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内 容 提 要 


本 书 以 JRockit 为 例 深 入 剖析 JVM 工作 原理 ， 分 为 3 大 部 分 。 第 一 部 分 着 重 介绍 了 JVM 和 自 适应 运 
行 时 的 工作 原理 ， 并 以 JRockit 为 例 专 门 介绍 到 底 什么 是 好 的 Java 第 二 部 分 介绍 JRockit Mission 
Control 套件 的 具体 功能 ， 以 及 如 何 使 用 SRockit Mission Control 套件 来 查找 应 用 程序 的 性 能 瓶颈 。 第 三 部 
分 介绍 Java 发 展 方向 。 
本 书 适合 所 有 以 Java 编程 语言 为 工作 中 心 的 开发 人 员 和 系统 管理 员 。 
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我 至 今 仍 然 清楚 地 记得 第 一 次 遇 到 JRockit 团队 时 的 情形 。 那 是 在 1999 年 , 我 代表 WebLogic 
参加 JavaOne 大 会 , 这 些 身 着 黑色 工 恤衫 的 瑞典 大 学 生 正 在 向 大 家 介绍 他 们 开发 的 、 号 称 性 能 最 
强劲 的 服务 器 端 虚 拟 机 。 那 时 ，HotSpot 1.2 版 本 的 发 布 再 次 延误 ， 而 我 们 也 正 被 Classic VM 中 
无 穷 无 尽 的 伸缩 性 问题 搞 得 焦头烂额 所 以 就 对 这 些小 伙 子 的 演讲 产生 了 兴趣 ,驻足 倾听 。 在 我 
离开 他 们 的 展台 时 ， 我 认为 这 些 聪 明 的 小 伙 子 还 有 些 稚嫩 ， 他 们 小 看 了 虚拟 机 开发 的 复杂 性 。 

时 光 飞 逝 ，BEA 收购 了 JRockit， 而 我 成 了 WebLogic 和 JRockit 两 个 团队 间 的 技术 沟通 人 。 
此 时 的 JRockit 已 非 吴 下 阿 蒙 ， 在 服务 器 端 表现 出 了 强大 的 伸缩 性 和 强劲 的 性 能 。 随 着 工作 的 展 
开 ， 我 也 很 未 幸 结 识 了 本 书 的 两 位 作者 : Marcus Lagergren 和 Marcus Hirt. 

当时 负责 编译 器 开发 的 Lagergren 是 一 位 非常 高 产 的 程序 员 。 曾 经 有 一 段 时 间 ， 我 和 他 共同 
研究 如 何 优化 WebLogic， 以 及 探究 为 何某 个 方法 没有 被 内 联 或 去 虚拟 化 。 在 这 个 过 程 中 ,我们 
(包括 WebLogic 团队 和 JRockit 团队 的 其 他 成 员 ) 合力 创造 了 SPECjAppServer 的 几 项 世界 纪录 ， 
使 得 TRockit R ER. 

本 书 的 男 一 位 作者 Hirt 则 始终 专注 于 性 能 前 析 和 诊断 方面 的 工作 。 因 此 , 他 也 顺理成章 地 成 
为 了 相关 工具 开发 的 领导 者 ， 这 些 工 具 就 是 JRockit Mission Control 的 前 身 。 我 们 很 早 就 注意 到 ， 
若 想 扩大 JRockit 工程 团队 的 规模 , 就 必须 投入 资源 来 开发 更 好 用 的 工具 , 以 简化 开发 和 调试 工作 。 

转眼 又 过 了 几 年 ， 我 加 入 了 Oracle, BEA 也 被 Oracle 收购 了 。 我 怀 着 激动 的 心情 再 次 迎接 
JRockit 团队 的 加 入 ,只 不 过 这 次 的 新 东家 换 成 了 Oracle。JRockit 的 核心 开发 团队 仍然 是 那些 人 ， 
他 们 现在 已 经 是 虚拟 机 领域 的 专家 了 。 

Lagergren 仍然 负责 底层 实现 ( 即 JRockit Virtual Edition) 的 开发 ， 生 产 力 依然 很 高 。 在 Hirt 
的 带领 下 ，Mission Control 已 经 从 内 部 开发 工具 成 长 为 最 受用 户 喜 爱 的 JRockit 开发 套件 之 一 。 
两 位 作者 对 JRockit 的 方方面面 都 非常 了 解 ， 很 难 想象 会 有 比 他 们 两 位 更 适合 撰写 本 书 的 人 了 。 

因此 ， 正 如 前 面 所 说 ， 能 够 结识 JRockit 开发 团队 并 与 其 合作 ， 我 感到 非常 高 兴 。 我 相信 ， 
你 会 享受 阅读 本 书 的 过 程 。 多 年 以 来 ， 我 觉得 本 书 主题 非常 有 趣 ， 希望 你 也 会 有 这 样 的 体会 。 
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机 缘 巧 合 促成 了 本 书 的 出 版 。 

ABET, 互联 网 还 没有 在 世界 范围 内 普及 , 我 们 也 还 只 是 高 中 生 , 经 常 混迹 于 同一 个 BBS, 在 
讨论 数学 问题 的 过 程 中 结识 了 对 方 , 成 为 了 好 友 , 并 将 这 份 友情 延伸 到 了 生活 和 合作 的 软件 项 目 
中 。 后 来 ,我 们 又 共同 进入 了 位 于 斯 德 哥 尔 摩 的 瑞典 皇家 理工 学 院 (KTH ) 学 习 。 

在 KTH， 我 们 结识 了 更 多 的 朋友 。 在 第 三 学 年 的 数据 库 系 统 课程 中 ， 我 们 找到 了 足够 多 志 
同道 合 的 人 ,准备 干 点 事业 。 最 终 ， 我们 决定 成 立 一 家 名 为 Appeal Software Solutions ( 其 首 字母 
缩写 为 A.S.S.， 当 时 看 来 绝对 是 一 个 完美 的 名 字 ) 的 咨询 公司 。 我 们 中 有 些 人 是 半 工 半 读 的 ,所 
以 预 留 了 部 分 收入 , 以 便当 所 有 成 员 毕 业 后 可 以 使 公司 步 入 正轨 。 我 们 的 长 期 目标 是 公司 可 以 开 
发 产品 ， 而 不 仅仅 是 做 咨询 ， 但 当时 我 们 还 不 知道 到 底 要 开发 什么 。 

1997 年 ， 由 于 在 Sun 公司 赞助 的 大 学 后 竞赛 中 胜出 ，Joakim Dahlstedt, Fredrik Stridsman 和 
Mattias Joélson 得 以 参加 当年 的 JavaOne 大 会 。 有 意思 的 是 ， 第 二 年 ， 他 们 又 胜出 了 。 

一 切 都 源 于 我 们 的 3 位 英雄 在 1997 年 和 1998 年 参加 的 两 届 JavaOne 大 会 。 在 会 上 ， 他 们 注 
意 到 ，Sun 公司 的 自 适 应 JVM 一 一 HotSpot 虽然 在 当时 被 誉 为 能 够 彻底 解决 Java 性 能 问题 的 终极 
JVM, 但 在 这 两 年 里 却 没 有 什么 实质 性 的 进步 。 那 时 的 Java 主要 是 解释 执行 的 , 市 场 上 有 一 些 
针对 Java 的 静态 编译 器 , 可 以 生成 运行 速度 快 于 字 节 码 的 静态 代码 , 但 是 这 从 根本 上 违反 了 Java 
的 语义 。 正 如 本 书 反 复 强 调 的 , 到 目前 为 止 ， 自 适应 解决 方案 在 运行 时 具有 远 超 静态 解决 方案 的 
潜力 ， 但 实现 起 来 也 更 困难 。 

1998 年 ，HotSpot 没什么 动作 ， 年 轻 气 盛 的 我 们 不 禁 问 道 :“ 这 很 难 吗 ? 看 我 们 做 一 个 更 好 、 
更 快 的 自 适 应 虚拟 机 出 来 !” 我 们 专业 背景 不 错 ， 而 且 认 为 有 了 明确 的 方向 ， 于 是 就 开工 了 。 尽 
管 后 来 的 实践 证 明了 挑战 比 我 们 预期 的 更 大 ， 但 我 们 想 提醒 读者 的 是 ， 当 时 是 1998 年 ，Java 在 
服务 器 端的 腾飞 才刚 刚 开 始 , PEE 刚刚 出 现 ， 几 乎 没 人 听 说 过 JSP。 因 此 , 我 们 所 涉及 的 问题 领 
域 小 得 多 。 

我 们 最 初 计划 用 一 年 时 间 实 现 一 个 JVM 的 预览 版 , 同时 继续 提供 咨询 服务 来 保证 JVM 的 持 
续 开 发 。 最 初 , 新 JVM 的 名 字 是 RockIT, 结合 了 Rock and Roll ( 摇滚 )、Rock Solid ( 坚 如 磐石 ) 
和 开 三 者 的 意思 。 后 来 由 于 注册 商标 的 原因 ， 又 在 名 字 前 面 加 了 一 个 字母 J 

在 经 历 了 初期 的 几 次 失败 后 , 我 们 需要 寻找 风 投 。 当 然 , 向 投资 人 解释 清楚 为 什么 投资 一 款 
自 适应 SVM 能 够 赚钱 ( 同时 期 的 其 他 竞争 对 手 都 是 免费 提供 的 )， 是 一 大 难题 。 这 不 仅仅 因为 当 
时 是 1998 年 ， 更 重要 的 因素 是 ， 投 资 人 还 无 法 理解 这 种 既 不 需要 给 用 户 发 广告 短信 ， 也 不 需要 



















































































































































































言 Vii 





发 送 电子 邮件 订单 的 商业 模式 。 

A, 我 们 获得 了 风 投 , 并 在 2000 年 初 发 布 了 JRockit 1.0 版 本 的 第 一 个 原型 。 尽 管 只 是 1.0 
版 本 (网 上 有 人 说 它 “ 非 常 1.0”， 不够 成 熟 )， 但 是 它 应 用 于 多 线程 服务 器 程序 时 性 能 优异 ， 风 
光一 时 。 以 此 为 契机 ,我 们 获得 了 更 多 的 投资 ,并 将 咨询 业务 拆 分 为 一 个 独立 的 分 公司 ,公司 的 
名 字 也 从 Appeal Software Solutions 变 成 了 Appeal Virtual Machines, 我 们 又 雇用 了 一 些 销售 人 员 ， 
并 就 Java 许 可 证 的 问题 开始 与 Sun 公司 协商 。 

JRockit 的 相关 工作 越 来 越 多 。2001 年 ， 处 理 咨询 业务 的 工程 师 都 转 人 了 与 JVM 相关 的 项 目 
中 ， 咨 询 公司 宣 告 停业 。 这 时 ， 我 们 清楚 地 知道 如 何 将 Rockit 的 性 能 再 提升 一 步 ， 同 时 也 意识 
到 在 这 个 过 程 中 我 们 消耗 资源 的 速度 太 快 了 。 于 是 ,管理 层 开 始 寻找 合适 的 大 公司 ,以 实现 整体 
收购 。 

2002 年 2 月 ，BEA 公司 收购 Appeal Virtual Machines 公司 ， 这 让 投资 人 松 了 一 口气 ， 同 时 也 
保证 了 我 们 有 足够 的 资源 做 进一步 的 研究 和 开发 。 为 了 配合 测试 ，BEA 建立 了 一 个 宽敞 的 服务 
器 机 房 ， 加 固 了 地 板 ， 保 证 了 电力 供应 。 那 时 ， 有 一 根 电缆 从 街 上 的 接线 盒 通 过 服务 器 机 房 的 窗 
户 连 进来 。 过 了 一 段 时 间 ,， 这 个 服务 器 机 房 已 经 无 法 放下 开发 测试 所 需 的 全 部 服务 器 了 ， 于 是 我 
们 又 租 了 一 个 机 房 来 放置 服务 器 。 

作为 BEA 平 台 的 一 部 分 ，JRockit 的 发 展 相 当 理想 。 在 BEA 的 前 两 年 ， 我 们 为 下 ockit 开发 
了 很 多 区 别 于 其 他 Java 解决 方案 的 新 特性 ， 例 如 后 来 发 展 成 为 JRockit Mission Control 的 开发 杠 
架 。 此 后 ， 新 闻 发 布 、 世 界 级 的 测试 跑 分 和 虚拟 化 平台 随 之 而 来 。 在 拥有 了 JRockit JG, BEA 与 
Sun, IBM 并 列 为 三 大 JVM 厂商 ,成 为 了 拥有 数 千 用 户 的 平台 。JRockit 产生 的 利润 ， 首 先是 来 
自 工具 套件 ， 然 后 是 产品 JRockit Real Time 提供 的 无 比 强大 的 GC HERE. 

2008 年 ，Oracle 收购 BEA， 这 一 事件 起 初 令 人 感到 不 安 , 但 是 JRockit 和 相关 团队 最 终 获得 
了 更 多 的 关注 和 赞誉 。 

经 过 这 些 年 的 发 展 ， 令 我 们 引 以 为 荣 的 是 ，JRockit 的 用 户 遍 布 全 球 ， 它 为 关键 应 用 的 稳定 
运行 保驾 护航 。 同 样 令 我 们 感到 骄傲 的 是 ， 当 初 6 个 少年 在 斯 德 哥 尔 摩 老 城区 的 一 个 小 破 屋 中 的 
设计 已 经 成 长 为 世界 级 产品 。 

本 书 的 内 容 是 我 们 十 多 年 来 与 自 适应 运行 时 ， 尤 其 是 JRockit， 打 交道 的 经 验 总 结 。 据 我 们 
所 知 ， 其 中 的 很 多 内 容 之 前 还 没有 发 表 过 。 

希望 本 书 能 对 你 有 所 帮助 和 启发 。 












































































































































内 容 概述 


第 1 章 : 起 步 。 这 一 章 对 JRockit JVM 和 JRockit Mission Control 做 了 简要 介绍 ， 内 容 包括 如 
何 获 得 相关 软件 及 软件 对 各 平台 的 支持 情况 ,在 切换 JVM 厂商 的 产品 时 需要 注意 的 问题 , JRockit 
和 JRockit Mission Control 版 本 号 的 命名 规则 ， 以 及 如 何 获 取 更 多 有 关 JRockit JVM 的 内 容 。 

第 2 章 : 自 适 应 代码 生成 。 这 一 章 对 自 适 应 运行 时 环境 中 的 代码 生成 做 了 简要 介绍 。 具 体 说 
来 ,解释 了 为 什么 在 JVM 中 实现 自 适 应 代码 生成 比 在 静态 环境 中 更 有 难度 ， 而 其 实现 所 能 发 挥 
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的 效用 却 更 加 强大 ; 介绍 了 赌博 式 的 性 能 优化 技术 ; 通过 一 个 例子 介绍 了 JRockit 的 代码 生成 和 
优化 流水 线 ; 讨论 了 自 适 应 代码 优化 和 传统 代码 优化 ; 介绍 了 如 何 使 用 标志 和 指令 文件 来 控制 
JRockit 的 代码 生成 。 

第 3 章 : 自 适 应 内 存 管理 。 这 一 章 对 自 适应 运行 时 环境 中 的 内 存 管理 做 了 介绍 。 通 过 介绍 自 
动 内 存 管 理 的 相关 概念 和 算法 ， 解 释 了 垃圾 回收 器 的 工作 机 制 。 详 细 介 绍 了 JVM 在 为 对 象 分 配 
内 存 时 所 做 的 具体 工作 , 以 及 为 便于 执行 垃圾 回收 所 需 记 录 的 元 数据 信息 。 后 半 部 分 主要 介绍 用 
于 控制 内 存 管 理 的 最 重要 的 Java API， 以 及 可 在 Java 应 用 程序 中 生成 确定 性 延迟 的 JRockit Real 
Time 产品 。 最 后 ,介绍 了 如 何 使 用 标志 来 控制 TRockit JVM 的 内 存 管 理 系统 。 

第 4 章 : 线程 与 同步 。 这 一 章 介 绍 了 Java 和 JVM 中 非常 重要 的 线程 与 同步 的 概念 及 其 在 JVM 
中 的 简要 实现 ,并 深入 讨论 了 Java 内 存 模型 及 其 内 在 的 复杂 性 。 简 单 介 绍 了 基于 运行 时 信息 反馈 的 
自 适应 优化 对 线程 和 同步 机 制 的 实现 的 影响 。 此 外 ， 还 以 双 检 查 锁 失 效 为 例 对 多 线程 编程 中 常见 的 
一 些 错误 做 了 介绍 。 最 后 讲解 了 如 何 分 析 JRockit 中 的 锁 ， 以 及 如 何 通过 标志 控制 线程 的 部 分 行为 。 

第 5 章 : 基准 测试 与 性 能 调 优 。 这 一 章 讨论 了 基准 测试 的 相关 性 ,以 及 制定 性 能 目标 和 指标 
的 重要 性 ; 阐释 了 如 何 针 对 特定 问题 设计 适合 的 基准 测试 介绍 了 一 些 针对 Java 的 工业 级 基准 
测试 套件 ; 详细 讨论 了 如 何 根据 基准 测试 的 结果 优化 应 用 程序 和 JVM; 以 JRockit JVM 为 介绍 了 
相关 命令 行 参数 的 使 用 。 

第 6 章 : JRockit Mission Control 套件 。 这 一 章 介 绍 了 JRockit Mission Control 工具 套件 ， 包 
括 启动 和 各 种 详细 配置 等 内 容 。 解 释 了 如 何在 Eclipse 中 运行 JRockit Mission Control， 以 及 如 何 配 
置 JRockit 以 使 Eclipse 在 JRockit 上 运行 。 介 绍 了 几 种 不 同 的 工具 ， 统 一 了 相关 术语 的 使 用 。 讲 解 
了 如 何 使 用 JRockit Mission Control 远程 访问 JRockit JVM， 以 及 与 故障 处 理 相 关 的 内 容 。 

第 7 Æ: Management Console。 这 一 章 介 绍 了 JRockit Mission Control 中 的 Management 
Console 组 件 , 讲解 了 诊断 命令 的 概念 以 及 如 何在 线 监控 JVM 实例 , 还 介绍 了 触发 器 规则 的 设置 
和 事件 通知 的 机 制 ， 最 后 讲解 了 如 何 利用 自 定义 组 件 扩展 Management Console. 

第 8 Æ: JRockit Runtime Analyzer。 这 一 章 介 绍 了 JRockit 运 行 时 分 析 器 ( JRockit Runtime 
Analyzer, JRA )， 它 是 一 款 可 以 定制 的 按 需 分 析 框 架 ， 用 于 详细 记录 JRockit 以 及 运行 在 其 中 的 
应 用 程序 的 执行 状况 , 以 便 进行 离线 分 析 。 其 记录 内 容 包 括 方法 和 锁 的 性 能 分 析 、 垃圾 回收 信息 、 
优化 决策 信息 、 对 象 统计 信息 以 及 延迟 事件 等 。 这 一 章 最 后 介绍 了 如 何 根据 这 些 记 录 信 息 来 判别 
常见 问题 以 及 如 何 延 迟 分 析 。 

第 9 章 : JRockit Flight Recorder。 这 一 章 详细 介绍 了 JFR (JRockit Flight Recorder )。 新 版 
本 JRockit Mission Control 套件 使 用 JFR 取代 了 JRA。 这 一 章 讲解 了 JFR JRA 的 区 别 ， 最 后 介 
绍 了 如 何 扩展 JFR。 

第 10 Æ: Memory Leak Detector。 这 一 章 介 绍 了 JRockit Mission Control 套件 中 的 最 后 一 个 
工具 JRockit Memory Leak Detector。 其 中 介绍 了 具有 垃圾 回收 功能 的 编程 语言 中 内 存 泄漏 的 概念 ， 
以 及 Memory Leak Detector 的 一 些 用 例 。Memory Leak Detector 不 仅 可 以 用 来 找 出 Java 应 用 程序 
中 意外 持 有 的 对 象 , 还 可 以 对 Java 堆 做 通用 分 析 。 此 外 还 介绍 了 Memory Leak Detector 的 一 些 内 
部 实现 机 制 ， 以 及 它 能 保持 很 低 的 运行 开销 的 原因 。 




























































































































































































$11: JRCMD。 这 一 章 介 绍 了 命令 行 工具 JRCMD。 用 户 可 以 通过 IRCMD 与 目标 机 器 
上 的 JVM 交互 ， 并 发 送 诊 断 命 令 。 这 一 章 按 字母 表 顺 序列 出 了 JRCMD 中 最 重要 的 诊断 命令 ， 
并 通过 示例 讲解 了 如 何 使 用 这 些 命令 来 检测 或 修改 TRockit JVM 的 状态 。 

第 12 章 : JRockit Management API。 这 一 章 介 绍 了 如 何 编程 实现 对 JRockit JVM 内 部 功能 
的 访问 ， 如 JRockit Mission Control 套件 就 是 基于 Management API 来 实现 的 。 尽 管 这 一 章 介 绍 的 
JMAPI 和 JMXMAPI 并 未 得 到 完整 的 官方 支持 ， 但 从 中 可 以 了 解 到 一 些 JVM 的 工作 机 制 。 希望 
读者 可 以 实际 动手 操作 一 下 ， 以 加 深 理解 。 

第 13 Æ: JRockit Virtual Edition. 这 一 章 介绍 了 现代 云 环境 中 的 虚拟 化 , 其 中 包括 了 JRockit 
Virtual Edition 产品 的 相关 概念 和 具体 细节 。 通 常 来 说 ， 操 作 系 统 很 重要 ， 但 对 于 JRockit Virtual 
Edition 来 说 , 移 除 软件 栈 中 的 操作 系统 层 并 不 是 什么 大 问题 , 而 且 移 除 之 后 还 可 以 降低 操作 系统 
层 所 带 来 的 性 能 开销 ， 降 低 的 程度 甚至 在 物理 硬件 上 也 达 不 到 。 













































































阅读 前 提 


请 正确 安装 Rockit JVM 和 运行 时 环境 。 为 了 更 好 地 理解 本 书 的 内 容 , 请 使 用 JRockit R28 或 其 
之 后 的 版 本 ,不 过 使 用 JRockit R27 也 是 可 以 的 。 此 外 ， 正 确 安装 Eclipse for RCP/Plug-in Developer 
也 很 有 必要 ， 尤 其 是 尝试 用 不 同 的 方法 扩展 JRockit Mission Control 以 及 使 用 源码 包 中 的 程序 时 。 














目标 读者 


本 书 主 要 面向 以 Java 为 工作 中 心 ， 并 已 具备 一 定 知识 技能 的 人 员 ， 例 如 对 Java 开发 或 安装 
管理 有 相关 工作 经 验 的 开发 人 员 或 系统 管理 员 。 书 中 内 容 分 为 3 大 部 分 。 

第 一 部 分 着 重 介绍 了 JVM 和 自 适 应 运行 时 的 作用 及 工作 原理 ， 还 指出 了 自 适应 运行 时 以 及 
JRockit 的 优势 和 劣势 ， 以 便 在 适当 的 时 候 解 释 什么 是 良好 的 Java 编码 实践 。 深入 到 JVM 这 个 黑 
盒 中 ， 探 查 运 行 Java 应 用 程序 时 到 底 发 生 了 什么 。 理 解 第 一 部 分 的 内 容 可 以 帮助 开发 人 员 和 架 
构 师 理解 某 些 设计 决策 的 后 果 , 进而 做 出 更 好 的 决策 。 这 部 分 也 可 作为 高 校 自 适应 运行 时 课程 的 
学 习 资料 。 

第 二 部 分 着 重 介绍 了 JRockit Mission Control 套件 的 具体 功能 ， 以 及 如 何 使 用 它 来 查找 应 用 
程序 的 性 能 瓶颈 。 对 于 想 要 对 JRockit 系统 做 性 能 调 优 以 运行 特定 程序 的 系统 管理 员 和 开发 人 员 
来 说 ， 这 部 分 内 容 非 常 有 用 。 对 于 希望 优化 Java 应 用 程序 以 提高 资源 利用 率 、 优 化 性 能 的 开发 
人 员 来 说 ， 这 部 分 内 容 也 很 有 用 。 但 应 该 记 住 的 是 ， 对 JVM 层面 的 调 优 也 只 有 这 么 多 了 ， 对 应 
用 程序 本 身 的 业务 逻辑 和 具体 实现 做 调 优 其 实 是 更 简单 、 更 有 效 的 。 本 书 将 会 介绍 如 何 使 用 
JRockit Mission Control 套件 来 查找 应 用 程序 的 瓶颈 ， 以 及 如 何 控制 硬件 和 程序 运行 的 成 本 。 

第 三 部 分 介绍 了 新 近 和 即将 发 布 的 重要 的 JRockit 相关 技术 ， 主 要 面向 对 Java 技术 发 展 方向 
比较 感 兴趣 的 读者 。 这 部 分 内 容 着 重 讲解 了 Java 虚拟 化 。 

最 后 ， 列 出 了 本 书 的 参考 文献 和 术语 表 。 




















































































































排版 约定 


本 书 中 会 包含 一 些 代码 ， 包 括 Java 代码 、 命 令 行 和 伪 代 码 等 。Java 代码 以 等 宽 字 体 表示 ， 
并 按照 标准 Java 格式 显示 。 命 令 行 和 参数 也 会 以 等 宽 字体 显示 。 类 似 地 ， 段 落 中 引用 的 文件 名 、 
代码 片段 和 Java 包 名 也 会 使 用 等 宽 字体 表示 。 

与 正文 相关 的 重要 一 些 信息 ， 或 是 补充 说 明 ， 会 使 用 中 括号 括 起 来 。 


| 此 部 分 内 容 很 重要 ! ] 


技术 名 词 和 基本 概念 会 作为 关键 字 用 黑体 字 表示 。 为 便于 查询 ， 这 些 技术 名 词 会 列 在 术语 
表 中 。 

在 本 书 中 ， 耻 OCKIT HOME 和 JAVA_HOME 表示 JRockit JDK/JRE 的 安装 目录 。 例 如 ， 默 
认 安 装 Rockit 之 后 ，Java 命令 的 位 置 是 : 

C:\jrockits\jrockit-jdk1.5.0_17\bin\java.exe 

mi JROCKIT_HOME 和 JAVA_HOME 的 值 则 为 : 

C:\jrockits\jrockit-jdk1.5.0_17\ 

JRockit JVM 有 其 自己 的 版 本 号 规则 ， 目 前 最 新 的 主 版 本 是 R28。JRockit 的 次 版 本 号 表示 在 
发 行 主 版 本 后 第 几 次 发 行 小 版 本 , 例如 R27.1 和 R27.2。 本 书 中 使 用 R27.x 表示 所 有 的 R27 版本， 
R28.x 表示 所 有 的 R28 版本。 


















































| 默认 情况 下 ， 本 书 所 介绍 的 内 容 是 以 R28 版 本 为 基础 的 ， 针 对 之 前 版 本 的 
~> 内 容 会 特别 说 明 。 

JRockit Mission Control 客户 端 使 用 了 更 加 标准 的 版 本 号 规则 ， 例 如 4.0。 在 介绍 JRockit 
Mission Control 的 相关 工具 时 ， 工 具 的 版 本 号 3.x 和 4.0 也 分 别 对 应 了 JRockit Mission Control 客 
户 端 的 版 本 。 在 写作 本 书 时 ，JRockit Mission Control 客户 端的 最 新 版 本 是 4.0， 除 非特 别 指明 ， 
所 有 内 容 均 是 以 此 版 本 为 基础 来 讲解 的 。 

书 中 内 容 有 时 会 涉及 一 些 第 三 方 产品 。 阅读 本 书 时 无 须 十 分 了 解 这 些 产 品 。 涉及 的 第 三 方 产 
品 如 下 。 

Q Oracle WebLogic Server: Oracle J2EE 应 用 服务 器 

Q Oracle Coherence: Oracle 内 存 型 分 布 式 缓存 技术 

Q Oracle Enterprise Manager: Oracle 应 用 程序 管理 套件 

O Eclipse: Java IDE (也 可 用 于 其 他 语言 的 开发 ) 

Q HotSpot™: HotSpot MJVM 
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读者 反馈 


欢迎 读者 反馈 对 本 书 的 看 法 ,喜欢 什么 、 不 喜欢 什么 , 这 对 我 们 开发 读者 真正 需要 的 选 题 来 
说 非常 重要 。 

要 发 送 反馈 信息 ， 可 以 直接 发 邮件 到 feedback@packtpub.com， 并 在 邮件 主题 中 注 明 书 名 。 
如 果 你 需要 某 本 书 ， 希望 我 们 出 版 的 话 ， 请 在 PacktPub 的 官网 www.packtpub.com 中 填写 表 
单 ， 或 者 发 邮件 到 suggest@packtpub.com 来 说 明 。 

如 果 读 者 精通 某 个 领域 ,并 日 想 要 撰写 或 参与 写作 一 本 书 的 话 ， 请 阅读 www.packtpub.com/ 
authors 中 的 作者 指南 。 


BPM 
针对 购买 了 Packt 图 书 的 读者 ， 我 们 提供 了 很 多 周边 内 容 ， 帮 助 你 更 好 地 理解 书 中 内 容 。 






































M 下 载 本 书 示 例 代码 
可 从 http://www.ituring.com.cn/book/2491 下 载 本 书 中 的 示例 代码 ， 以 及 代码 
的 使 用 说 明 。 


勘误 


尽管 我 们 尽力 确保 书 中 内 容 无 误 , 但 错误 在 所 难免 。 如 果 读 者 发 现 了 错误 , 不 管 是 文字 错误 
还 是 代码 错误 ， 敬 请 告知 , 我们 将 感激 不 尽 。 这 不 仅 可 使 其 他 读者 免 受 错误 困扰 ,还 可 以 帮助 我 
们 完善 本 书后 续 的 版 本 。 如 果 读 者 发 现 了 任何 错误 ， 请 访问 http://www.packtpub.com/support， 选 
择 书 名 ， 然 后 点 击 let us know 链接 ,输入 勘误 的 具体 内 容 。" 当 勘误 通过 验证 后 ， 内 容 将 被 接受 ， 
而 且 该 勘误 信息 将 上 传 到 我 们 的 网 站 ,或 者 添加 到 该 书 下 面 Errata 部 分 的 已 有 勘误 表 列 表 当 中 。 
在 http://www.packtpub.com/support 可 以 看 到 目前 已 有 的 勘误 表 。 







































































盗版 问题 


对 所 有 媒体 来 说 ， 互 联网 盗版 都 是 一 个 长 期 存在 的 问题 。Packt 公司 对 自己 的 版 权 和 许可 证 
的 保护 非常 严格 。 如 果 你 在 互联 网 上 遇 到 以 任何 形式 非法 复制 我 们 作品 的 行为 , 请 立刻 向 我 们 提 
供 具体 地 址 或 网 站 名 称 ， 以 帮助 我 们 采取 补救 措施 。 

请 通过 copyright@packtpub.com 联系 我 们 ， 并 且 附 上 可 疑 盗 版 资料 的 链接 。 

感谢 你 帮助 我 们 保护 作者 ， 使 我 们 能 够 带 给 你 更 有 价值 的 内 容 。 




















D 针对 本 书 中 文 版 的 勘误 ， 请 到 http://www.ituring.com.cn/book/2491 查看 和 提交 。 一 一 编者 注 





























疑问 
如 果 读 者 对 本 书 有 任何 疑问 ， 请 发 邮件 至 questions@packtpub.com 说 明 ， 我 们 会 尽力 解决 。 
致谢 





感谢 这 些 年 一 直 陪 伴 在 我 们 身边 的 宣 有 创造 力 的 人 们 。 特 别 是 Appeal 的 同事 ， 你 们 已 经 成 
为 我 们 生活 的 一 部 分 ， 我 们 很 荣幸 能 与 如 此 卓越 的 团队 分 享 这 段 历程 。 
此 外 ， 非 常 感谢 我 们 的 家 人 ， 感 谢 你 们 在 本 书写 作 期 间 给 予 我 们 的 耐心 和 支持 。 























电子 书 
扫描 如 下 二 维 码 ， 即 可 购买 本 书 电子 版 。 
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虽然 本 书 各 个 部 分 ( 主要 是 第 一 部 分 ) 包含 了 关于 所 有 自 适 应 运行 时 环境 的 内 部 工作 原理 的 
一 般 性 信息 ， 但 示例 和 深入 的 信息 都 是 针对 JRockit JVM 的 。 本 章 简要 介绍 了 如 何 获取 JRockit 
JVM, VASO Java 应 用 部 署 到 JRockit JVM 上 时 可 能 遇 到 的 问题 等 。 
在 本 章 中 ， 你 将 学 到 如 下 内 容 : 
口 如 何 获取 JRockit 
口 JRockit 对 各 平台 的 支持 情况 
口 如 何 将 应 用 迁移 到 JRockit 
O JRockit 命令 行 选项 简介 
O JRockit 版 本 号 命名 规则 
口 遇 到 问题 时 该 如 何 求助 











1.1 获取 JRockit JVM 





为 了 更 好 地 理解 本 书 的 内 容 , 推荐 使 用 最 新 版 本 的 JRockit JVM 作为 实验 工具 。 对 于 JRockit 
R27.5 之 前 的 版 本 来 说 ， 要 想 使 用 某 些 高 级 特性 是 需要 获取 相关 授权 的 。 在 Oracle 收购 了 BEA 
公司 后 ， 对 这 些 高 级 特性 的 限制 得 以 解除 ,现在 可 以 随时 使 用 ,无 须 担 心 授 权 问题 ， 这 使 得 开发 
人 员 可 以 在 开发 环境 中 更 好 地 研究 和 使 用 JRockit SVM, 当然 , 如 果 想 在 生产 环境 中 使 用 JRockit, 
仍然 是 需要 购买 授权 的 。 对 于 Oracle 的 客户 来 说 ， 这 不 是 什么 问题 ， 因 为 Oracle 的 大 部 分 应 用 
套件 都 包含 了 JRockit JVM， 例 如 所 有 包含 了 WebLogic Server 的 套件 都 包含 JRockit JVM. 

在 编写 本 书 之 时 ， 获 取 JRockit JVM 的 最 简单 方式 就 是 下 载 并 安装 JRockit Mission Control 
(一 个 用 于 诊断 和 剖析 JRockit JVM 的 工具 套件 ) JRockit Mission Control 发 行 版 的 安装 目录 几乎 
与 JDK 的 安装 目录 相同 , 可 以 当 作 JDK 使 用 。 我 们 很 希望 能 够 为 JRockit 提供 一 个 自 包含 的 、 只 
有 JVM 的 JDK， 不 过 暂时 未 能 实现 ， 希 望 在 不 远 的 将 来 能 有 所 改观 。 

TE FÆ JRockit Mission Control 之 前 ， 请 先 确 认 你 所 使 用 的 平台 是 在 支持 范围 之 内 的 ， 几 是 
支持 JRockit 的 平台 ， 也 都 支持 JRockit Mission Control 的 服务 端 组 件 。 

下 表 展 示 了 JRockit Mission Control 3.1.x 在 各 个 平台 的 支持 情况 。 


































































































平 S Java 1.4.2 Java 5.0 Java 6 

Linux x86 x x x 

Linux x86-64 N/A x x 

Linux Itanium x【〔 仅 服务 器 端 ) x【〔 仅 服务 器 端 ) N/A 

Solaris SPARC ( 64 fiz ) x【〔 仅 服务 器 端 ) x【〔 仅 服务 器 端 ) x〔 仅 服务 器 端 ) 
Windows x86 x x x 

Windows x86-64 N/A x《〈 仅 服务 器 端 ) x〔 仅 服务 器 端 ) 
Windows Itanium x【〔 仅 服务 器 端 ) x【〔 仅 服务 器 端 ) N/A 





下 表 展 示 了 JRockit Mission Control 4.0.0 在 各 个 平台 的 支持 情况 。 





平 台 Java 5.0 Java 6 
Linux x86 x x 
Linux x86-64 x x 
Solaris SPARC ( 64 fiz ) x【〔 仅 服务 器 端 ) x【〔 仅 服务 器 端 ) 
Windows x86 x x 
Windows x86-64 x【〔 仅 服务 器 端 ) x〈 仅 服务 器 端 ) 





如 果 在 Windows 平台 上 运行 JRockit Mission Control， 请 确保 操作 系统 的 临 
时 目录 所 在 的 文件 系统 可 以 针对 每 个 用 户 单独 设置 文件 访问 权限 。 换 句 话 说, 临 
时 目录 不 要 设置 在 FAT 格式 的 磁盘 上 ， 否 则 ， 某 些 关键 特性 ( 例如 本 地 JVM 的 
自动 检测 ) 将 无 法 使 用 。 


1.2 ”将 应 用 程序 迁移 到 JRockit 


本 书 中 ，JRockit JVM 的 安装 目录 以 ROCKIT HOME 指 代 ， 将 之 设 为 系统 变量 可 以 使 操作 
更 简便 。 安 装 完成 后 ， 顺 便 将 JROCKIT HOME/bin 目录 添加 到 系统 环境 变量 PATH 路 径 中 ， 并 
更 新 应 该 迁移 到 JRockit 的 Java 应 用 程序 的 脚本 。 建议 读者 将 环境 变量 JAVA_HOME 的 值 设 置 为 
了 ROCKIT HOME 指 代 的 目录 。 大 部 分 情况 下 ，JRockit 都 可 以 直接 替代 其 他 JVM， 但 某 些 启 动 
参数 需要 调整 ， 例 如 某 些 控制 具体 垃圾 回收 行为 的 参数 ， 这 在 不 同 JVM 厂商 之 间 有 较 大 差别 。 
其 他 一 些 比 较 通用 的 参数 ， 例 如 设置 堆 大 小 的 最 大 值 ， 在 设置 的 时 候 是 相同 的 。 


















































更 多 有 关 将 应 用 程序 迁移 到 JRockit JVM 的 信息 ， 请 参见 JRockit 在 线 文档 
中 “Migrating Applications to the Oracle JRockit JDK” 一 章 的 内 容 。 


1.2 将 应 用 程序 迁移 到 JRockit 3 





1.2.1 命令 行 选项 


在 JRockitJVM 中 ,主要 有 3 类 命令 行 选项 , 分 别 是 系统 属性 、 标 准 选项 ( 以 -x 开头 ) 和 非 
标准 选项 ( 以 -xx 开头 )。 

1. 系统 属性 

设置 JVM 启动 参数 的 方式 有 多 种 。 以 -D 开头 的 参数 会 作为 系统 属性 使 用 ,这 些 属性 可 以 为 
Java 类 库 ( 如 RMI 等 ) 提 供 相 关 的 配置 信息 ,例如 , 在 启动 的 时 候 , 如 果 设 置 了 -Dcom.jrockit. 
mc .debug=true 参数 ， 则 JRockit Mission Control 会 打印 出 调试 信息 。 不 过 ，R28 之 后 的 JRockit 
JVM 版 本 废弃 了 很 多 之 前 使 用 过 的 系统 属性 , 转 而 采用 非 标准 选项 和 类 似 HotSpot 中 虚拟 机 标志 
( VM flag ) 的 方式 设置 相关 选项 。 

2. 标准 选项 

以 -x 开头 的 选项 是 大 部 分 JVM 厂商 都 支持 的 通用 设置 。 例如， 用 于 设置 堆 大 小 最 大 值 的 选 
项 -xmx 在 包括 JRockit 在 内 的 大 部 分 JVM 中 都 是 相同 的 。 当 然 , 也 存在 例外 , 如 JRockit 中 的 选 
项 -xverbose 会 打印 出 可 选 的 子 模块 日 志 信息 ， 而 在 HotSpot 中 ， 类 似 的 (但 实际 上 有 更 多 的 
限制 ) 选项 是 -verbose。 

3. 非 标准 选项 

以 -XX 开头 的 命令 行 选 项 是 各 个 JVM 厂商 自己 定制 的 。 这 些 选 项 可 能 会 在 将 来 的 某 个 版 本 
中 被 废弃 或 修改 。 如 果 JVM 的 参数 配置 中 包含 了 以 -XX 开头 的 命令 行 选项 ， 则 在 将 Java 应 用 程 
序 从 一 种 JVM 迁移 到 另 一 种 时 ， 应 该 在 启动 JVM 之 前 去 除 这 些 非 标准 选项 。 

确定 了 新 的 JVM 选项 后 才 可 以 启动 Java 应 用 程序 。 通常, Java 应 用 程序 迁移 到 JRockit JVM 
后 ， 内 存 消耗 会 有 些许 增加 ， 但 能 够 获得 更 好 的 性 能 。 
应 该 通过 查询 目标 JVM 的 文档 来 确定 要 使 用 的 非 标 准 命 令 行 选项 是 否 在 不 同 JVM 厂商 之 间 
和 不 同 JVM 版 本 之 间 具 有 相同 的 语义 。 

o 虚拟 机 标志 

JRockit R28 之 后 的 版 本 ， 添 加 了 被 称 为 虚拟 机 标志 的 命令 行 选项 ， 作 为 非 标准 命令 行 选 项 
的 子 集 使 用 ,其 语法 是 : -xx:<flag>=<value>。 使 用 命令 行 工 具 IRCMD 可 以 读 取 这 些 虚 拟 机 
标志 的 值 ， 并 且 可 以 修改 某 些 VM 标志 的 值 。 更 多 关于 JRCMD 的 内 容 ， 请 参见 第 11 章 。 


1.2.2 ”行为 差异 


不 同 的 JVM 可 能 会 有 不 同 的 运行 时 行为 ,通常 这 是 因为 不 同 的 JVM 对 Java 语 言 规范 和 JVM 
规范 有 不 同 的 实现 。 请 注意 ， 各 个 JVM 的 行为 虽 有 不 同 ,但 都 是 正确 的 。 规 范 中 的 很 多 地 方 没 
有 做 强制 规定 ， 为 JVM 厂商 实现 独 具 特 色 的 功能 留 出 了 余地 。 如 果 某 个 应 用 程序 严重 依赖 于 规 
范 的 某 种 具体 实现 ， 那 么 迁移 该 应 用 程序 到 其 他 实现 时 处 怕 就 不 那么 容易 了 。 

例如 ， 曾 经 在 旧版 本 Eclipse 上 测试 IRcokit 的 里 程 碑 版 本 时 ， 某 些 测试 用 例 无 法 在 JRockit 
上 启动 。 后 来 发 现 ， 由 于 这 些 测试 之 间 具 有 依赖 性 ， 测 试 需要 以 特定 的 顺序 进行 ， 而 JRockit 中 
通过 反射 获取 的 方法 列表 ( class#getDeclaredMethods ) 的 实现 与 其 他 JVM 不 同 , 导致 返回 
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方法 列表 的 顺序 有 所 区 别 ， 尽 管 这 并 不 违反 规范 ， 却 导致 了 测试 无 法 正常 进行 。 后 来 ，Eclipse 
的 开发 团队 确认 了 “依赖 方法 列表 的 顺序 ”是 错误 的 。 最 终 测试 用 例 得 以 正确 运行 。 

如 果 在 编写 应 用 程序 时 不 遵守 Java 语 言 规范 或 JVM 规范 , 而 是 以 某 款 JVM 的 特殊 行为 作为 
依据 , 那么 将 来 该 应 用 程序 可 能 无 法 在 同一 个 JVM 厂商 的 新 版 本 JVM 中 正常 运行 。 如 果 在 编写 
应 用 程序 时 遇 到 相关 问题 ， 请 查阅 Java 语言 规范 和 IDK 相关 文档 。 

将 应 用 程序 从 一 款 JVM 迁移 到 另 一 款 JVM 时 ， 要 特别 注意 两 款 JVM 之 间 的 区 别 。 在 原先 
的 JVM 上 能 够 正常 运行 的 应 用 程序 ， 可 能 由 于 一 些 洪 在 的 问题 而 无 法 在 新 的 JVM 上 继续 运行 ， 
例如 应 用 程序 在 不 同 的 JVM 上 具有 不 同 的 性 能 表现 。 这 可 能 会 导致 一 些 问 题 的 发 生 ， 但 不 应 将 
之 归 笨 于 JVM, 

例如 ， 曾 有 客户 报告 说 ，JRockit 只 运行 了 一 天 就 月 溃 了 。 经 过 调查 发 现 ， 该 客户 的 应 用 程 
序 在 其 他 JVM 上 运行 时 , 也 会 发 生 崩 演 , 只 不 过 多 运行 了 几 天 而 已 。 之 所 以 JRockit 表演 得 更 快 ， 
是 因为 该 应 用 程序 在 JRockit 上 运行 得 更 快 ， 内 存 泄 漏 的 速度 更 快 而 已 。 

当然 , 所 有 的 JVM, 包括 JRockit， 都 可 能 存在 bug。 为 了 自称 是 Java， 每 个 JVM 实现 都 必 
须 使 用 Java Compatibility Kit (JCK) 进行 大 量 的 兼容 性 测试 。 

JRockit 一 直 是 使 用 分 布 式 测试 系统 进行 各 种 测试 的 。 这 个 大 测试 套件 包含 了 JCK， 通 过 这 
个 测试 可 以 保证 发 布 的 JRockit 是 一 款 稳定 、 合 格 、 兼 容 Java 的 JVM。 在 发 行 新 版 本 的 JRockit 
之 前 , 会 使 用 该 测试 套件 , 在 JRockit 上 运行 各 种 知名 应 用 程序 , 例如 Eclipse, WebLogic Server, 
以 及 专门 设计 用 来 进行 压力 测试 的 程序 , 这 些 测试 会 在 所 有 受 支 持 的 平台 上 进行 , 以 测试 JRockit 
是 否 会 发 生 故 障 。 此 外 ， 对 性 能 做 持续 的 回归 测试 也 是 IRockit QA 工作 的 重 中 之 重 。 但 即便 如 
此 ， 故 障 仍然 无 法 避免 。 如 果 JRockit 崩溃 了 ， 请 将 详细 情况 报告 给 Oracle 的 支持 工程 师 。 












































































































































1.3 JRockit 版 本 号 的 命名 规则 


JRockit 版 本 号 的 命名 规则 有 点 复杂 ， 至 少 包含 以 下 3 部 分 : 

(1) JRockit JVM 版 本 号 

(2) JDK 版 本 号 

(3) JRockit Mission Control 版 本 号 

查看 JVM 版 本 号 的 方法 是 在 命令 行 中 执行 命令 java -version， 典 型 的 输出 如 下 所 示 。 


java version "1.6.0_14" 











Java(TM) SE Runtime Environment (build 1.6.0_14-b08) 


Oracle JRockit(R) (build R28.0.0-582-123273-1.6.0_ 
14-20091029-2121-windows-ia32, compiled mode) 


JRockit 版 本 号 的 第 一 个 部 分 是 与 JVM 绑 定 的 IDK 的 版 本 号 。 该 IDK 版 本 与 标准 IDK 版 本 
同步 ， 也 就 是 与 随 HotSpot 发 行 的 JDK 版 本 相同 。 从 上 面 的 例子 可 以 看 到 ，Java 的 版 本 是 1.6, 
更 新 版 本 号 是 14-b08。 如 果 你 想 看 某 个 JDK 发 行 版 中 修复 了 哪些 安全 问题 ， 就 可 以 直接 查看 这 
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个 版 本 号 下 对 应 的 发 行 信息 。 二 
JRockit 版 本 号 以 字母 R 开头 。 在 上 面 的 例子 中 ，JRockit 的 版 本 号 是 R28.0.0。 每 个 版 本 的 

JRockit JVM 都 可 以 支持 多 个 版 本 的 IDK. 例如 ，R27.6.5 支持 Java 1.4, Java 1.5 和 Java 1.6, 而 

在 JRockitR28 中 ，JDK 1.4 已 经 不 在 支持 范围 内 了 。 
紧 跟 JRockit JVM 版 本 号 的 是 构建 号 ， 然 后 是 修改 号 。 在 上 面 的 例子 中 ， 构 建 号 是 582， 修 

改 号 是 123273, Java 版 本 号 是 1.6.0_ 14， 在 这 之 后 的 两 个 数字 是 构建 的 日 期 (使 用 ISO 8601 格 

st) 和 时 间 (CET， 欧 洲 中 部 时 间 )， 再 后 面 是 操作 系统 和 CPU 架构 信息 。 
在 命令 行 中 执行 命令 jrmc -version 或 jrmc -version | more 可 以 查看 JRockit Mission 

Control 的 版 本 号 。 

































































1.4 获取 帮助 


Oracle Technology Network 中 有 很 多 关于 JRockit 和 JRockit Mission Control 的 有 用 资源 ， 
例如 博客 、 文 章 和 论坛 。JRockit 开发 人 员 和 支持 人 员 始 终 关注 论坛 内 容 ， 即 使 读者 无 法 在 已 有 
的 内 容 中 找到 所 需 的 答案 , 相关 人 员 也 会 在 提出 问题 的 几 天 之 内 做 出 回复 。 如 果 某 些 问 题 经 常 提 
及 ， 就 会 被 置 项 ， 例 如 如 何 获取 老 版 本 JRockit 的 授权 文件 。 








1.5 小结 





本 章 简要 介绍 了 JRockit JVM， 包 括 如 何 安装 JRockit， 以 及 在 将 Java 应 用 程序 从 其 他 JVM 
迁移 到 JRockit JVM 时 应 该 注意 的 事情 。 

此 外 ,还 介绍 了 JRockit JVM 支持 的 几 种 不 同 的 命令 行 参 数 , 并 举例 说 明了 如 何 查 看 JRockit 
JDK 的 版 本 号 中 的 相关 信息 。 

最 后 ， 提 供 了 一 些 学 习 和 使 用 JRockit 时 可 能 会 用 到 的 帮助 信息 。 








自 适 应 代码 生成 








本 章 介 绍 JVM 运行 时 环境 中 的 代码 生成 和 代码 优化 , 既 有 通用 概念 , 也 有 Rockit 代码 生成 
的 内 部 机 制 。 首先 介绍 Java 字 节 码 格式 和 JIT 编译 器 的 运行 机 制 , 并 举例 说 明 自 适应 运行 时 所 能 


发 挥 的 威力 。 然 后 深入 JRockit JVM, 详细 介绍 


代码 生成 和 优化 。 
在 本 章 ， 你 将 学 到 如 下 内 容 : 
O 平台 独立 性 的 语言 (如 Java) 的 好 处 











能 赌博 ”的 具体 含义 























口 如 何 控 制 JRockit 中 的 代码 生成 融 


2.1 平台 无 关 性 


Java 诞生 之 初 的 一 大 卖点 , 也 是 使 其 成 为 主流 纺 





O Java 字 节 码 格式 和 JVM 规范 的 关键 信息 
O JVM 如 何 解 释 执 行 字 节 码 以 执行 Java 程序 
口 自 适 应 环境 中 的 优化 与 静态 预先 编译 的 对 比 ， 前 者 效果 好 但 难于 实现 的 原因 ， 以 及 “性 








O 为 什么 自 适应 运行 时 中 的 代码 生成 能 发 挥 更 大 的 威力 
口 如 何 将 Java 编译 为 本 地 代码 ， 面 临 的 主要 问题 是 什么 。 哪 些 优化 是 应 该 由 Java 程序 员 做 
的 ， 哪 些 是 由 JVM 做 的 ， 或 者 哪些 优化 是 字 节 码 级 的 
口 JRockit 代码 流水 线 的 工作 原理 和 设计 初衷 


























程 语言 的 关键 点 ， 就 是 


“一 次 编写 


代码 生成 的 内 容 。 最 后 介绍 如 何 控制 JRockit 中 的 


， 到 处 运 


行 ”的 理念 。Java 编译 器 会 将 源 代码 编译 为 平台 无 关 的 、 压 缩 的 Java 字 节 码 ， 即 .class 文件 。 运 
行 的 时 候 , 无 须 针 对 不 同 的 硬件 架构 重新 编译 Java 应 用 程序 ， 因 为 运行 Java 程序 的 JVM 是 平台 
相关 的 ， 最 终 由 它 负责 将 字 节 码 转换 为 本 地 代码 。 























这 种 运行 方式 大 大 提升 了 程序 的 可 移植 性 
程序 会 被 直接 编译 为 平台 相关 的 格式 ， 极 大 地 





， 而 使 用 其 他 一 些 编程 语言 (如 C++ ) 编写 的 应 用 























降低 了 灵活 性 。 以 x86 架构 为 例 ，C++ 编 译 需 可 能 


会 对 程序 做 大 量 的 针对 x86 平 台 的 优化 ,所 以 编译 后 的 应 用 程序 也 只 能 在 x86 架构 的 平台 上 运行 ， 




















无 法 直接 移植 到 SPARC 平台 上 , 必须 要 重新 编译 , 而 且 可 能 还 不 得 不 使 用 一 款 优 化 能 力 弱 于 x86 








平台 的 编译 器 才 行 。 此 外 ,如 果 x86 平 台 本 身 














改 了 升级 ， 添 加 了 新 的 指令 ， 








那么 已 经 编 














译 过 的 程 
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序 就 无 法 利用 这 些 新 的 特性 ， 除 非 是 重新 编译 一 遍 。 当 然 ， 可 以 通过 只 发 行 源 代码 的 方式 来 间接 
达到 可 移植 性 的 要 求 , 但 可 能 又 会 受到 各 种 授权 的 限制 。 而 对 Java 来 说 , 可 移植 性 问题 交 由 JVM 
解决 ， 程 序 员 无 须 为 此 操心 。 
就 Java 来 说 ,凡是 安装 有 JVM 的 平台 都 可 以 运行 Java 程序 。 具 有 平台 独立 特性 的 字 节 码 并 
JE Java 发明， 而 且 之 前 已 经 应 用 于 其 他 几 种 编程 语言 ， 例 如 Pascal 和 Smalltalk, {E Java 是 第 
一 个 将 之 作为 一 大 卖点 推广 的 。 

Java 刚 刚 出 现时 ， 使 用 Java 编写 的 应 用 程序 大 多 是 Applet 形式 的 小 程序 ， 用 于 艇 入 到 Web 
浏览 器 中 运行 ， 是 典型 的 客户 端 应 用 程序 。 然 而 ， 跨 平台 并 非 Java 的 唯一 亮点 ， 它 还 包括 其 他 
一 些 令 人 兴奋 的 特性 , 例如 内 建 的 内 存 管理 、 缓 冲 越界 保护 和 安全 沙 箱 模型 等 。 这 些 特性 使 Java 
不 仅 可 以 用 于 客户 端 程序 的 开发 ， 还 可 以 满足 服务 右 端 复杂 业务 逻辑 的 开发 要 求 。 

经 过 几 年 的 努力 发 展 , Java 在 服务 器 端 开发 的 能 力 终于 得 到 了 广泛 认可 ,其 固有 的 健壮 性 使 
其 开发 速度 快 于 C++， 因 此 得 以 在 服务 需 端 开发 中 广 为 采 用 。 当 应 用 程序 逻辑 很 复杂 时 ， 更 短 的 
开发 周期 就 显得 尤为 重要 ， 这 一 点 在 服务 器 端 开发 领域 更 受 关注 。 



































































































































2.2 Java 虚拟 机 


尽管 使 用 平台 无 关 的 字 节 码 可 以 完全 满足 不 同 平台 对 可 移植 性 的 要 求 , 但 实际 上 , CPU 本 身 
并 不 能 直接 执行 字 节 码 指令 ， 它 只 认识 本 地 代码 。 

















在 本 书 中 ， 专 用 于 某 个 硬件 架构 的 代码 称 为 本 地 代码 (native code )。 
tite, SF x86-F SRB, x86 汇编 语言 和 X86 机 器 代码 即 为 本 地 代码 。 机 器 


Me OS 


™ 


代码 是 二 进 制 的 平台 相关 的 代码 ,而 汇编 语言 则 是 以 人 类 可 读 的 形式 表示 的 机 器 
代码 。 





因此 ，JVM 需要 将 字 节 码 转 化 为 匹配 当前 硬件 架构 的 本 地 代码 供 CPU 执行 。 具 体 有 以 下 两 
种 实现 方式 (也 可 能 会 综合 使 用 这 两 种 方式 )。 
O JVM 规范 将 JVM 描述 为 一 个 状态 机 器 , 因此 实际 上 并 不 需要 真 的 将 字 节 码 转化 为 本 地 代 
码 执行 JVM 可 以 完整 模拟 Java 程序 的 执行 状态 ,例如 可 以 将 每 条 字 节 码 模 拟 为 一 个 JVM 
状态 函数 。 这 种 方式 称 为 字 节 码 解 释 执 行 (bytecode interpretation )， 在 这 种 情况 下 ， 唯 一 
直接 执行 的 本 地 代码 ( 这 里 暂 不 考虑 INI) 就 是 JVM 本 身 。 

O JVM 将 字 节 码 编译 为 匹配 目标 平台 的 本 地 代码 ， 然 后 再 调用 执行 这 些 本 地 代码 。 一 般 情 
况 下 ， 将 字 节 码 编 译 为 本 地 代码 这 一 步 发 生 在 某 个 方法 第 一 次 被 调用 的 时 候 。 这 个 过 程 
就 是 众所周知 的 即时 编译 〈( Just-In-Time compilation, +i! JIT 编译 )。 

自然 地 ， 将 字 节 码 编译 为 本 地 代码 后 ， 程 序 的 执行 效率 会 比 解释 执行 快 几 个 数量 级 ， 不 过 ， 

这 是 以 额外 的 信息 记录 和 编译 时 间 为 代价 的 。 
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2.2.1 基于 栈 的 虚拟 机 


JVM 是 一 种 基于 栈 的 虚拟 机 ， 绝 大 部 分 字 节 码 操作 都 是 处 理 操 作 数 栈 的 内 容 ， 从 栈 中 弹出 
AE, 计算 , 再 将 结果 放 回 栈 中 。 例如 ,执行 求 和 操作 时 , 会 将 两 个 操作 数 入 栈 , 执行 加 法 指令 ， 
它 会 使 用 到 这 两 个 操作 数 ， 然 后 将 加 法 的 结果 入 栈 ， 使 用 结果 的 时 候 再 将 操作 结果 出 栈 。 

除了 操作 数 栈 之 外 ， 按 照 字 节 码 的 格式 ， 还 有 多 达 65 536 个 寄存 器 可 以 使 用 。 寄 存 器 也 称 
为 局 部 变量 (local variable )。 

在 字 节 码 格式 中 ,操作 指令 都 被 编码 在 一 个 字 节 中 ,也 就 是 说 ，Java 最 多 支持 256 种 操作 码 
(opcode )， 每 种 操作 都 对 应 着 一 个 唯一 值 和 类 似 于 汇编 指令 的 助 记 符 ( mnemonic )。 































































































长 久 以 来 ， JVM 规 范 中 只 增加 了 一 个 新 的 操作 码 ， 即 0xba， 这 个 值 是 为 了 
将 来 提供 对 invokedynamic 操作 的 支持 而 预 留 的 。 该 操作 用 于 解决 将 动态 语言 
(例如 Ruby ) 编译 为 字 节 码 时 遇 到 的 动态 分 派 (dynamic dispatch ) 问题 。 更 多 有 
关 将 字 节 码 应 用 于 动态 语言 的 内 容 ， 请 参见 Java Specification Request ( JSR) 292 
的 描述 。 


2.2.2” 字 节 码 格式 
下 面 的 代码 展示 了 名 为 ada 的 方法 及 其 编译 后 的 字 节 码 格式 : 


public int add(int a, int b) { 
return a + b; 


} 





public int add(int, int); 
Code: 


0: iload_1 // stack: a 

1: iload_2 // stack: a, b 
2: iadd // stack: (a+b) 
3 ireturn // stack: 


} 

函数 add 有 两 个 输入 参数 a 和 b， 分 别 被 放 人 局 部 变量 槽 1 和 局 部 变量 槽 2 中 在 这 个 例 
子 中 ,方法 add 是 一 个 实例 方法 。 根 据 JVM 规范 ， 实 例 方 法 局 部 变量 槽 0 中 存放 的 是 this )。 
前 两 个 操作 ， 即 iload_1 fi iload 2， 用 于 将 局 部 变量 槽 1 和 局 部 变量 档 2 中 的 值 放 入 到 操作 
数 栈 中。 第 三 个 操作 iaaa 从 操作 数 栈 中 弹出 两 个 数 ， 对 其 求 和 ， 并 将 结果 入 栈 。 第 四 个 操作 
ireturn 弹出 之 前 计算 出 的 和 ， 以 该 值 作为 返回 值 ， 方 法 结束 。 上 面 例子 中 的 每 一 步 字 节 码 操 
作 旁 边 都 有 关于 操作 数 栈 操作 的 注释 ， 读 者 可 自行 揣摩 。 


| 使 用 IDK 附带 的 命令 行 工 具 javap 可 以 对 字 节 码 进 行 反 汇编 。 | 





































































































2.2 Java 虚拟 机 9 





1. 操作 与 操作 数 

JVM 字 节 码 是 一 种 非常 紧凑 的 格式 , 前 面 例子 中 的 方法 的 字 节 码 表 示 只 用 了 4 字 节 ( 源 代码 
的 一 小 部 分 )。 每 种 操作 都 使 用 一 个 字 节 表示 ， 后 跟 一 个 可 选 的 、 长 度 可 变 的 操作 数 。 一 般 情况 
下 ， 带 有 操作 数 的 字 节 码 指令 的 长 度 不 会 超过 3 FE 

下 面 的 代码 是 判断 一 个 数 是 否 为 偶数 的 函数 ,及 其 编译 为 字 节 码 后 的 样子 。 字 节 码 使 用 十 六 
进 制 的 数字 加 以 标注 ， 分 别 表示 字 节 码 的 操作 码 和 操作 数 的 值 : 

public boolean even(int number) { 


return (number & 1) == 


} 












































public boolean even(int) ; 


Code: 
0: iload_1 // 0x1b number 
Ls iconst_1 // 0x04 number, 1 
2 iand // 0x7e (number & 1) 
3: ifne 10 // 0x9a 0x00 0x07 
6: iconst_1 // 0x03 1 
7 goto 11 // Oxa7 0x00 0x04 
10 iconst_0 // 0x03 
11: ireturn // Oxac 


} 

在 上 面 的 代码 中 , 首先 将 传人 的 参数 number 和 常量 1 压 入 到 操作 数 栈 中 , 然后 将 它们 都 弹 
出 求 和 ， 即 执行 iana 指令 ， 并 将 结果 压 人 操作 数 栈 。 指 令 ifne 进行 条 件 判断 ， 从 操作 数 栈 中 
弹出 一 个 操作 数 做 比较 判断 ， 如 果 不 是 0 的话， 就 跳 转 到 其 他 分 支 运行 。 指 令 iconst_0 将 常量 
0 压 和 人 到 操作 数 栈 中 ， 其 操作 码 为 0x03， 无 须 后 跟 操作 数 。 类 似 地 ， 指 令 iconst_1 会 将 常量 
1 压 人 操作 数 栈 中 。 返 回 值 为 布尔 类 型 时 是 使 用 常量 整数 来 表示 的 。 

比较 和 跳 转 指令 ， 例 如 ifne (MRA UB, FTE 0x9a )， 通 常 需 要 使 用 两 个 字 
节 的 操作 数 ( 以 满足 16 位 跳 转 偏 移 的 要 求 )。 


举 个 例子 ， 假 如 某 条 指令 是 ， 若 条 件 判 断 的 值 为 true， 则 将 指令 指针 向 前 
移动 10 000 字 节 的 话 ， 那 么 这 个 操作 的 编码 应 该 是 0x9a 0x27 0x10 ( 注意 ， 
0x2710 是 10 000 的 十 六 进 制 表示 。 字 节 码 中 数字 的 存储 是 大 端 序 的 )。 






































字 节 码 中 还 包含 其 他 一 些 复杂 结构 ， 例 如 分 支 跳 转 ， 是 通过 在 tableswitch 指令 后 附加 包 
含 了 所 有 跳 转 侦 移 的 分 支 跳 转 表 实现 的 。 

2. 常量 池 

程序 , 包含 数据 和 代码 两 部 分 ,其 中 数据 作为 操作 数 使 用 。 对 于 字 节 码 程 序 来 说 ， 如 果 操 作 
数 非常 小 或 者 很 常用 ( 如 常量 0)， 则 这 些 操 作 数 是 直接 内 髓 在 字 节 码 指 令 中 的 。 

较 大 块 的 数据 ， 例 如 常量 字符 串 或 比较 大 的 数字 ， 是 存储 在 .class 文件 开始 部 分 的 常量 ; 
(constant pool) 中 的 。 当 使 用 这 类 数据 作为 操作 数 时 ,使 用 的 是 常量 池 中 数据 的 索引 位 置 ， 而 不 
是 实际 数据 本 身 。 以 字符 串 数 据 averyLongFunctionName 为 例 ， 如 果 在 编译 方法 时 每 次 都 要 
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重新 编码 这 个 字符 串 的 话 ， 那 字 节 码 就 谈 不 上 压缩 存储 了 。 
此 外 ，Java 程序 中 的 方法 、 属 性 和 类 的 元 数据 等 也 作为 .class 文件 的 组 成 部 分 ， 存储 在 常量 
池 中 o 


2.3 ”代码 生成 策略 


JVM 执行 字 节 码 指 令 时 有 几 种 不 同 的 方式 ， 如 以 字 方 码 解释 器 来 模拟 字 节 码 的 执行 ， 以 及 
将 全 部 代码 编译 为 匹配 某 个 平台 的 本 地 代码 再 执行 。 


2.3.1 纯 解释 执行 


早期 的 JVM 使 用 解释 器 来 模拟 字 节 码 指令 的 执行 。 为 了 简化 实现 , 解释 器 就 是 在 一 个 主 函数 
中 加 上 一 个 包含 了 所 有 操作 码 的 分 支 跳 转 结构 。 调 用 该 函数 时 ， 会 附带 上 表示 操作 数 栈 和 局 部 变 
量 的 数据 结构 ， 以 此 作为 字 节 码 操作 的 输入 输出 。 总 体 来 看 , 解释 器 的 核心 代码 最 多 也 就 几 千 行 。 

纯 解 释 执行 这 种 方式 简单 有 效 ， 如果 想 要 添加 对 新 硬件 架构 的 支持 ,只 需 简单 修改 代码 , E 
新 编译 即 可 , 无 须 编 写 新 的 本 地 编译 器 。 而 且 写 一 个 本 地 编译 器 的 代码 量 也 比 写 一 个 使 用 分 支 跳 
转 结果 的 纯 解 释 带 大 得 多 。 
解释 器 在 执行 字 节 人 码 时 几乎 不 需要 记录 和 额外 的 信息 ， 而 编译 执行 的 JVM 会 将 一 些 或 全 部 字 
节 码 编译 为 本 地 代码 , 这 时 就 需要 跟踪 所 有 经 过 编译 的 代码 。 如 果 某 个 方法 在 应 用 程序 运行 过 程 
中 发 生 了 改变 (Java 里 可 以 这 么 做 )， 就 需要 重新 生成 代码 。 相 比 之 下 ， 解 释 需 只 需 要 在 下 次 模 
拟 调用 时 再 解释 一 过 新 的 字 节 码 就 可 以 了 。 

因为 解释 执行 所 需要 记录 的 额外 信息 极 少 ， 所 以 就 很 适用 于 像 JVM 这样 在 运行 过 程 中 随时 
可 能 改变 代码 的 自 适 应 运行 时 。 

当然 , 相 比 于 执行 编译 为 本 地 代码 的 方式 , 纯 解 释 执行 的 性 能 很 差 。 Sun 公司 的 Classic Virtual 
Machine 起 初 就 是 使 用 纯 解释 执行 的 方式 。 

之 前 的 示例 代码 中 ， 编 译 后 的 方法 有 4 个 字 节 码 指令 ， 使 用 C 语言 编写 解释 器 来 运行 的 话 ， 
可 能 需要 多 达 10 倍 的 本 地 指令 才能 完成 。 相 比 之 下 ， 编 译 为 本 地 代码 的 ada 方法 最 多 只 需要 两 
条 汇编 指令 就 足够 了 ， 即 add 和 return. 


int evaluate(int opcode, int* stack, int* localvars) { 
switch (opcode) { 





























































































































case iload_l: 

case iload_2: 
int lslot = opcode - iload 1; 
stack[sp++] = localvars[lslot]; 
break; 

case iadd: 
int sum = stack[--sp] + stack[--sp]; 
stack[sp++] = sum; 
break; 

case ireturn: 
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return stack[--sp]; 


} 
} 


上 面 的 示例 代码 以 伪 代 码 展示 解释 器 如 何 执行 add 方法 ， 从 中 可 以 看 到 ， 即 使 是 如 此 简单 
的 ada 方法 ,在 JVM 中 运行 时 ， 也 需要 数 十 条 汇编 指令 才能 完成 ， 而 编译 为 本 地 代码 后 只 需要 
两 条 汇编 指令 ， 这 就 是 纯 解 释 执行 性 能 差 的 原因 。 

在 x86 平 台 上 ， 经 过 JIT 编译 的 add 会 生成 如 下 代码 : 


add eax, edx // eax = edx+eax 
ret // return eax 





















































有 时 为 了 更 好 地 阅 述 观点 , 书 中 会 贴 出 一 些 汇编 代码 , 不 要 担心 ， 即 使 读者 
gL 之 前 没有 学 习 过 汇编 语言 ,也 能 够 明白 其 中 的 含义 。 但 是 , 为 了 更 好 地 理解 本 书 
> 的 内 容 , 读者 最 好 了 解 一 些 低 级 语言 的 基本 概念 。 如果 你 实在 无 法 理解 本 书 中 列 

出 的 汇编 语言 ， 也 不 必 担 心 ， 这 并 不 影响 你 理解 本 书 的 核心 内容。 


2.3.2 静态 编译 


Java 诞生 的 初期 , 为 了 避免 解释 执行 字 节 码 所 带 来 的 性 能 问题 , 程序 员 迫 不 得 已 使 用 了 一 些 
“简单 粗暴 ”的 方法 ， 即 静态 编译 。 那 时 ，Java 程序 在 运行 之 前 ， 会 被 直接 编译 为 本 地 代码 ， 这 
种 方式 称 为 预 编译 (ahead-of-time compilation )。 其 实 ， 就 是 把 Java “4 C++ 用 。 

随 着 Java 中 静态 编译 的 完善 ，20 世纪 90 年 代 后 期 市 场 上 出 现 了 不 少 这 样 的 产品 , 它们 将 字 
节 码 转换 为 C 语言 代码 ， 再 由 C 语言 编译 器 将 之 编译 为 本 地 代码 。 大 部 分 情况 下 ， 静 态 编译 生 
成 的 代码 的 执行 效率 比 纯 解 释 执行 高 得 多 。 不 过 ， 这 种 方式 却 抛弃 了 Java 语言 的 动态 特性 ， 也 
无 法 妥善 应 对 在 运行 过 程 中 代码 发 生变 化 的 情况 。 

静态 编译 的 一 大 劣势 就 是 抛弃 了 Java 语言 平台 独立 的 特性 。 在 这 里 ，JVM 已 经 被 无 视 了 。 

静态 编译 所 带 来 的 另 一 个 问题 是 ,Java 中 的 内 存 本 来 是 自动 管理 的 , 现在 却 或 多 或 少 需要 手 
动 执行 管理 操作 ， 严 重 影响 伸缩 性 。 

随 着 Java 语言 的 动态 特性 受到 广泛 关注 ， 其 在 服务 需 端 发 挥 的 作用 越 来 越 大 ， 静 态 编译 模式 
也 变 得 越 来 越 不 实用 。 例 如 ， 服 务 器 端 应 用 程序 可 能 会 在 运行 过 程 中 产生 大 量 的 JSP (Java server 
page ), 实际 上 是 把 静态 编译 咒 作 为 JIT 编译 器 使 用 , 运行 起 来 会 慢 一 些 , 自 适应 特性 也 会 差 一 些 。 









































































































































尽管 静态 预 编 译 这 个 方案 并 不 适合 于 实现 Java, 但 可 以 用 在 其 他 地 方 , 例如 
预 分 析 ( ahead-of-time analysis )。 程 序 分 析 是 很 耗费 时 间 的 ， 如 果 能 够 在 程序 运 
行 之 前 ， 在 离线 环境 下 完成 部 分 程序 分 析 工 作 ， 并 与 JVM 就 这 部 分 信息 交互 ， 
可 以 使 程序 运行 得 更 好 。 例如 ， 将 性 能 分 析 数 据 以 注解 的 形式 存储 到 .class X 
件 中 ， 可 以 帮助 JVM 更 好 地 运行 目标 应 用 程序 。 
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2.3.3 完全 JIT 编译 


另 一 种 加 速 字 节 码 执行 速度 的 方法 是 彻底 抛弃 解释 锅 ， 当 首次 调用 某 个 Java 方法 时 ,将 其 
编译 为 本 地 代码 。 这 种 编译 方式 是 发 生 在 运行 时 的 , 在 JVM 内 部 完成 ,因此 不 属于 预 编译 范畴 。 

与 静态 预 编 译 不 同 ， 在 运行 时 编译 更 适合 具有 动态 特性 的 Java 编程 语言 。 

完全 JIT 编译 的 好 处 是 不 需要 维护 解释 器 ,但 缺点 是 编译 时 间 影 响 主体 业务 程序 的 运行 。 编 
译 咒 对 所 有 方法 一 视 同 仁 , 在 编译 那些 热 方法 的 同时 ,也 会 编译 那些 执行 次 数 较 少 的 ,甚至 只 执 
行 一 次 的 方法 。 实 际 上 ， 这 些 方法 本 可 以 解释 执行 的 。 


经 常 调 用 的 方法 称 为 热 方法 (hotmethod )， 而 那些 不 经 常 调用 的 、 对 程序 的 
| 整体 性 能 没 ) | 




































































能 没什么 影响 的 方法 则 称 为 冷 方法 (cold method )。 





上 面 提 到 的 问题 ， 可 以 通过 在 JIT 编译 器 中 添加 不 同 层级 的 编译 操作 来 修正 。 例 如 ， 在 首次 
调用 某 个 方法 的 时 候 ， 先 提供 一 个 编译 快速 的 但 优化 得 不 太 完 善 的 版 本 。 当 JVM 探查 到 某 个 方 
法 是 热 方 法 时 , 例如 对 该 方法 的 调用 次 数 超过 了 某 个 阐 值 , 准备 重新 编译 这 个 方法 ,这 时 就 可 以 
使 用 一 些 复杂 的 优化 方法 了 。 当 然 ， 这 种 方式 花费 在 编译 上 的 时 间 更 多 。 

完全 JIT 编译 的 主要 缺点 在 于 生成 代码 的 速度 太 慢 。 对 同一 个 方法 来 说 ， 编 译 为 本 地 代码 后 
的 执行 效率 比 直接 解释 执行 高 数 百 倍 ,， 但 准备 执行 的 时 间 却 长 数 百 倍 。 使 用 完全 JIT 编译 这 种 方 
式 时 需要 特别 注意 的 是 , 尽管 检测 热 方法 的 机 制 比较 先进 , 但 仍 要 慎重 考虑 执行 效率 和 准备 时 间 
的 问题 ， 权 衡 得 失 。 就 算 运 行 时 使 用 编译 快速 、 优 化 不 完全 的 JIT 编译 器 ， 其 准备 执行 的 时 间 仍 
然 比 纯 解 释 执行 长 得 多 ， 因 为 解释 器 根本 不 需要 编译 工作 。 

使 用 完全 JIT 编译 的 男 一 个 问题 是 ,在 程序 运行 过 程 中 会 产生 大 量 废弃 代码 。 如 果 某 个 方法 
重新 生成 了 , 例如 由 于 编译 峰之 前 所 做 的 假设 失效 或 由 于 对 方法 进行 了 优化 , 那么 之 前 生成 的 老 
代码 仍然 会 占用 内 存 。 因 此 ，JVM 需要 某 种 “垃圾 回收 ”机 制 来 清理 这 些 已 经 废弃 的 代码 ， 否 
则 ， 对 于 大 量 使 用 JIT 编译 的 系统 来 说 ， 最 终 会 由 于 代码 缓冲 区 容量 的 增长 而 消耗 掉 所 有 本 地 内 
存 资源 。 

JRockit JVM 的 代码 生成 策略 是 在 完全 JIT 编译 的 基础 上 加 以 改进 而 成 的 。 

















































































































































































































2.3.4 混合 模式 


最 早 提出 的 在 不 牺牲 Java 动态 特性 的 情况 下 提升 程序 执行 效率 的 解决 方案 是 以 混合 模式 
( mixed mode interpretation ) 运行 程序 。 

使 用 混合 模式 时 , 首次 调用 某 个 方法 时 都 是 以 解释 器 来 执行 的 , 但 当 检 测 到 某 个 方法 是 热 方 
法 时 ， 则 安排 JIT 编译 器 将 之 编译 为 运行 性 能 更 好 的 本 地 代码 。 这 种 方法 与 上 一 节 中 提 到 的 使 用 
不 同 编译 等 级 的 JIT 编译 生成 不 同 质量 的 本 地 代码 类 似 。 

对 于 现代 JVM 来 说 ， 无论 是 编译 执行 还 是 解释 执行 ， 在 执行 过 程 中 检测 出 热 方法 是 一 项 基 
本 功能 ,后 文 会 对 此 详细 阐述 。 早 期 的 混合 模式 通过 记录 方法 的 调用 次 数 来 查找 热 方 法 ,如 果 调 
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用 次 数 超过 了 某 个 阔 值 ， 启 劲 JIT 编译 器 执行 优化 编译 工作 。 

与 完全 SIT 编译 类 似 , 在 混合 模式 中 ,JVM 只 会 优化 编译 那些 热 方法 ， 以 期 获得 最 好 的 执行 
效果 ， 而 对 那些 很 少 执行 的 方法 ，JVM 不 会 花费 时 间 去 编译 ， 但 仍 需要 在 每 次 调用 它们 时 更 新 
相关 信息 。 

在 混合 模式 中 , 会 记录 编译 过 的 代码 。 如 果 某 个 已 经 编译 过 的 方法 需要 重新 生成 , 或 者 之 前 
编译 时 的 假设 条 件 已 经 失效 ， 那 么 JVM 会 直接 抛弃 已 经 编译 出 的 本 地 代码 ， 下 次 调用 该 方法 时 
会 再 次 由 解释 器 解释 执行 。 此 后 ， 如 果 该 方法 仍然 够 热 ， 届 时 会 重新 执行 优化 编译 工作 。 




























































































Sun 公司 是 第 一 家 启用 混合 模式 的 JVM 厂商 ， 他 们 将 之 整合 到 HotSpot JIT 

编译 器 中 , 支持 客户 端 版 本 和 服务 器 端 版 本 (后 者 对 代码 的 优化 编译 能 力 更 强 )。 

> HotSpot 中 的 混合 模式 技术 来 源 于 其 收购 的 Longview Technologies 有 限 公 司 ( Bp 
Animorphic 公司 )。 


2.4 自 适 应 代码 生成 


Java 本 身 具 有 动态 性 , 因此 , 在 选择 代码 生成 策略 时 需要 根据 实际 场景 慎重 考虑 。 从 前 文 的 
讨论 中 可 以 得 出 以 下 结论 。 
口 代码 生成 应 该 在 运行 过 程 中 进行 ， 而 不 是 预先 完成 。 
口 代码 生成 器 不 应 该 对 所 有 方法 一 视 同仁 ， 而 应 该 将 热 方法 和 冷 方 法 区 别 对 待 。 和 否则， 就 
会 消耗 宝贵 的 资源 优化 编译 冷 方法 ， 更 糟 的 是 ， 有 可 能 使 本 应 该 对 热 方法 做 的 优化 编译 
因 资 源 不 足 而 无 法 进行 。 
O 自 适应 运行 时 的 JIT 编译 器 需要 记录 一 些 额 外 的 信息 来 确保 在 必要 时 刻 能 够 重新 生成 本 
地 代码 。 
无 论 在 自 适应 运行 时 环境 中 使 用 何 种 代码 生成 策略 ， 代 码 执行 效率 都 可 以 用 下 式 表示 : 
总 体 执行 时 间 = 代码 生成 时 间 + 代码 执行 时 间 
换 句 话说 ， 如 果 JVM 把 大 量 精力 用 在 生成 代码 、 优 化 代码 上 , 尽管 可 以 使 生成 代码 的 质量 更 高 ， 
却 会 使 总 体 执行 时 间 增 加 。 人 们 总 是 希望 JVM 能 把 所 有 时 间 和 资源 都 用 在 执行 自己 编写 的 业务 
代码 上 ， 而 不 是 用 来 做 垃圾 回收 或 代码 生成 。 
但 实际 上 ， 如 果 不 花 精力 来 为 代码 生成 做 准备 的 话 ， 运 行 效率 又 会 较 低 , 仍然 会 使 总 体 执行 
时 间 变 长 。 
为 了 能 够 对 此 做 出 取舍 ，JVM 需要 知道 对 哪些 方法 做 优化 编译 是 能 够 收回 成 本 的 。 
当然 ， 还 有 一 些 其 他 因素 会 对 总 体 执行 时 间 (total execution time ) 产生 影响 ， 例 如 JVM fh 
行 的 垃圾 回收 ,但 这 些 内 容 超出 了 本 章 的 范畴 , 第 3 章 会 对 此 详细 阐述 。 这 里 需要 提 到 的 是 ， 有 
时 候 代码 优化 可 以 通过 产生 更 高 效 的 代码 来 降低 JVM 执行 垃圾 回收 带 来 的 效率 损耗 ， 例 如 应 用 
逃逸 分 析 〈escape analysis ) 来 减少 创建 对 象 的 操作 或 者 直接 在 栈 上 创建 对 象 ， 后 文 会 介绍 。 

































































































































































14 2% 自 适 应 代码 生成 


B 





2.4.1 判断 热 方法 


正如 之 前 提 到 的 , 对 自 适 应 运行 时 来 说 , 纯 解 释 执行 或 完全 JIT 编译 都 不 是 真正 实用 的 策略 ， 
前 者 执行 效率 太 低 ， 后 者 编译 代码 的 时 间 又 太 长 ， 都 会 延长 总 体 执行 时 间 。JVM 不 能 对 所 有 方 
法 一 视 同仁 ， 为 了 确定 是 否 要 将 目标 方法 编译 为 本 地 代码 ， 就 需要 知道 这 个 方法 是 否 够 热 。 

正如 前 面 章节 中 提 到 的 , 有 几 种 途径 可 以 用 来 判断 某 个 方法 是 否 够 热 。 通常 都 会 对 代码 执行 
时 间 进 行 采样 , 由 运行 时 来 决定 是 否 执行 优化 编译 。 采 样 数 据 收集 的 越 多 , 运行 时 所 做 出 的 决策 
就 越 准确 。 如 果 只 简单 地 对 几 个 方法 进行 采样 ， 是 无 法 对 代码 的 执行 情况 做 出 准确 判断 的 , 但 同 
时 ， 收 集 采 样 数据 本 身 也 会 产生 性 能 损耗 ， 这 就 是 一 个 平衡 取舍 的 问题 了 。 

1. 调用 计数 器 

调用 计数 器 (invocation counter ) 可 以 用 来 对 热 方法 进行 采样 ， 它 会 跟踪 每 个 方法 ， 每 次 调 
用 方法 时 都 会 将 计数 器 加 1， 这 可 以 通过 字 节 码 解释 器 或 通过 在 方法 被 编译 为 本 地 代码 时 插入 额 
外 的 add 指令 实现 。 

而 对 于 使 用 JIT 编译 器 的 运行 时 来 说 ,尽管 不 像 纯 解释 器 执行 得 那么 低 效 , 但 调用 计数 器 仍 
可 能 因为 CPU 中 缓存 失效 等 问题 而 降低 运行 时 的 执行 效率 。 这 是 因为 每 次 调用 方法 时 都 会 附带 
调用 aaa 指令 ， 从 而 频繁 对 内 存 中 的 某 个 位 置 执 行 写 操作 。 

2. 基于 软件 的 线程 采样 

还 有 一 种 采样 方式 可 以 有 效 地 利用 缓存 , 这 就 是 线程 采样 。 这 种 方法 会 周期 性 地 检查 当前 正 
在 运行 的 Java 线程 ， 记 录 其 指令 指针 的 内 容 ， 因 此 无 须 对 原始 代码 做 修改 。 

为 了 获取 线程 的 上 下 文 信息 ， 就 需要 将 线程 挂 起 , 但 挂 起 线程 的 代价 却 非常 大 。 因 此 ， 要 想 
在 不 打 断 任何 线程 执行 的 情况 下 完成 大 量 的 采样 工作 ，JVM 就 需要 自己 实现 线程 ， 而 这 是 定制 
的 操作 系统 (例如 Oracle JRockit Virtual Edition ) 或 者 专用 硬件 才 有 的 特性 。 

3. 硬件 采样 

某 些 硬件 平台 ,例如 Intel IA-64， 提 供 了 可 供应 用 程序 使 用 的 硬件 增强 机 制 ， 例 如 硬件 指令 
指针 寄存 器 采样 缓冲 (hardware IP sample buffer )。 尽 管 针 对 IA-64 平台 生成 代码 非常 复杂 ， 但 至 
少 硬件 架构 可 以 保证 以 较 低 的 成 本 完成 采样 工作 ， 因 此 可 以 更 好 地 制定 优化 决策 。 

硬件 采样 的 男 一 个 优势 是 ,除了 指令 指针 寄存 器 的 数据 外 ,还 可 以 低 成 本 获得 其 他 多 项 数据 ， 
例如 硬件 分 析 器 ( hardware profiler ) 可 以 输出 分 支 预测 判断 错误 或 CPU 缓存 失效 的 频率 的 相关 
数据 ， 而 运行 时 可 以 使 用 这 些 信息 对 代码 做 更 有 针对 性 的 优化 , 例如 ,通过 修改 导致 分 支 预测 失 
败 的 判断 条 件 来 避免 分 支 预测 错误 ， 以 及 通过 预 抓 取 数 据 避免 CPU 缓存 失效 的 问题 。 因 此 ， 高 
效 的 硬件 采样 为 自 适 应 运行 时 环境 能 够 生成 高 效 的 本 地 代码 打下 了 坚实 的 基础 。 


2.4.2 ”优化 动态 程序 


在 汇编 代码 中 ,方法 调用 是 通过 call 指令 完成 的 。 不 同 平台 上 call 指令 的 具体 形式 不 尽 
相同 ， 不 同类 型 的 call 指令 ， 其 具体 格式 也 不 尽 相 同 。 
在 面向 对 象 的 语言 中 ， 虚 拟 方法 分 派 通常 被 编译 为 对 分 派 表 ( dispatch table ) 中 地 址 的 间接 
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调用 (indirect call， 即 需要 从 内 存 中 读 取 真 正 的 调用 地 址 )。 这 是 因为 ， 根 据 不 同 的 类 继承 结构 ， 
分 派 虚 拟 调用 时 可 能 会 有 多 个 接收 者 。 每 个 类 中 都 有 一 个 分 派 表 , 其 中 包含 了 其 虚拟 调用 的 接收 
者 信息 。 静 态 方法 和 确 知 只 有 一 个 接收 者 的 虚拟 方法 可 以 被 编译 为 对 固定 调用 地 址 的 直接 调用 
(direct call), 一般 来 说 ， 这 可 以 大 大 加 快 执 行 速度 。 


在 本 地 代码 中 ， 静 态 调用 是 类 似 于 这 样 的 : 


call 0x2345670 7 跳 转 到 指定 位 置 
而 虚拟 调用 是 这 样 的 : 
SS mov eax, [esi] ; ;从 寄存 器 esi 中 获取 地 址 信息 
call [eax+0x4c] ; ;0x4cC 是 分 派 表 中 偏 移 ，[eax + 0x4c] 是 调用 的 具体 位 置 
从 上 面 的 例子 可 以 看 出 , 执行 虚拟 调用 需要 访问 2 次 内 存 , 执行 速度 比 静 态 
调用 慢 。 





假设 应 用 程序 是 使 用 C++ 开发 的 , 对 代码 生成 器 来 说 , 在 编译 时 已 经 可 以 获取 到 程序 的 所 有 
结构 性 信息 。 例 如， 由 于 在 程序 运行 过 程 中 ,代码 不 会 发 生变 化 ， 所 以 在 编译 时 就 可 以 从 代码 中 
判断 出 ， 某 个 虚拟 方法 是 否 只 有 一 种 实现 。 正 因 如 此 ,编译 右 不 仅 不 需要 因为 废弃 代码 而 记录 和 额 
外 的 信息 ， 还 可 以 将 那些 只 有 一 种 实现 的 虚拟 方法 转化 为 静态 调用 。 

假如 应 用 程序 是 使 用 Java 开发 的 ， 起 初 某 个 虚拟 方法 可 能 只 有 一 种 实现 ， 但 Java 允许 在 程 
序 运行 过 程 中 修改 方法 实现 。 当 SIT 编译 器 需要 编译 某 个 虚拟 方法 时 ， 更 喜欢 的 是 那些 永远 只 存 
在 一 种 实现 的 , 这 样 编译 器 就 可 以 像 前 面 提 到 的 C++ 编译 器 一 样 做 很 多 优化 ,例如 将 虚拟 调用 转 
化 为 直接 调用 。 但 是 ， 由 于 Java 允许 在 程序 运行 期 间 修改 代码 ， 如 果 某 个 方法 没有 声明 final 
修饰 符 , 那 它 就 有 可 能 在 运行 期 间 被 修改 ， 即 使 它 看 起 来 几乎 不 可 能 有 其 他 实现 ， 编 译 器 也 不 能 
将 之 优化 为 直接 调用 。 

在 Java 世界 中 ， 有 一 些 场景 现在 看 起 来 一 切 正常 ， 编 译 器 可 以 大 力 优化 代码 ,但 是 如 果 某 
天 程序 发 生 了 改变 的 话 ， 就 需要 将 相关 的 优化 全 部 撤销 。 对 于 Java 来 说 ， 为 了 能 够 媲美 C++ 程 
序 的 执行 速度 ， 就 需要 一 些 特殊 的 优化 措施 。 

JVM 使 用 的 策略 就 是 “ 赌 "。JVM 代码 生成 策略 的 假设 条 件 是 ， 正 在 运行 的 代码 永远 不 变 。 
事实 上 ,大 部 分 时 间 里 确实 如 此 。 但 如 果 正 在 运行 的 代码 发 生 了 变化 , 违反 了 代码 优化 的 假设 条 
件 ， 就 会 触发 其 短 记 系统 (bookkeeping system) 的 回调 功能 。 此 时 ， 基 于 原先 假设 条 件 生成 的 
代码 就 需要 被 废弃 掉 , 重新 生成 , 例如 为 已 经 转化 为 直接 调用 的 虚拟 调用 重新 生成 相关 代码 。 因 
此 ,“ 赌 输 ” 的 代价 是 很 大 的 ,但 如 果 “ 赌 赢 ” 的 概率 非常 高 ， 则 从 中 获得 的 性 能 提升 就 会 非常 
大 ， 值 得 一 试 。 

一 般 来 说 ，JVM 和 JIT 编译 器 所 做 的 典型 假设 包括 以 下 几 点 。 

口 虚拟 方法 不 会 被 覆盖 。 由 于 某 个 虚拟 方法 只 存在 一 种 实现 , 就 可 以 将 之 优化 为 一 个 直接 调用 。 
口 浮 点 数 的 值 永 远 不 会 是 NaN。 大 部 分 情况 下 ， 可 以 使 用 硬件 指令 来 替换 对 本 地 浮 点 数 函 
数 库 的 调用 。 
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O 某 些 try 语句 块 中 几乎 不 会 抛 出 异常 。 因 此 ,可 以 将 catch 语句 块 中 的 代码 作为 冷 方法 
对 待 。 
O 对 于 大 多 数 三 角 函数 来 说 , 硬件 指令 fsin 都 能 够 达到 精度 要 求 。 如 果真 的 达 不 到 ， 就 抛 
出 异常 ， 调 用 本 地 浮 点 数 函 数 库 完 成 计算 。 
口 锁 竞 争 并 不 会 太 激烈 ， 初 期 可 以 使 用 自 旋 锁 ( spinlock ) 替代 。 
口 锁 可 能 会 周期 性 地 被 同一 个 线程 获取 和 释放 ， 所 以 ， 可 以 将 对 锁 的 重复 获取 操作 和 重复 
释放 操作 直接 省 略 掉 。 
在 使 用 预 编 译 的 静态 环境 中 , 程序 是 运行 在 封闭 世界 的 , 不 需要 做 上 述 假 设 。 但 对 于 自 适 应 
运行 时 来 说 , 当 实际 情况 违反 了 假设 条 件 后 , 就 需要 撤销 之 前 所 做 的 相关 决策 ,理论 上 ,只 要 JVM 
可 以 用 较 小 的 代价 完成 撤销 工作 ,就 可 以 做 任何 激进 的 假设 , 继而 执行 激进 的 代码 优化 策略 。 
此 ,基于 “ 赌 ” 这 个 机 制 ， 只 要 成 本 收益 合适 ， 自 适应 运行 时 所 能 发 挥 的 威力 就 会 比 静态 环境 强 
大 得 多 。 
其 实 ,“ 赌 赢 ” 并 不 容易 。 如 果 将 小 概率 事件 误 判 为 频繁 发 生 的 事件 ， 为 了 避免 重新 生成 代 
码 ， 只 要 不 奢求 程序 执行 效率 可 以 像 静态 编译 一 样 ， 其 实 应 用 程序 还 是 可 以 正常 运行 的 。 但 如 果 
将 频繁 发 生 的 事件 误 判 为 小 概率 事件 ， 就 会 由 于 频繁 的 重 优化 或 去 优化 而 大 大 延长 代码 生成 时 
间 。 这 里 就 涉及 如 何 取 舍 的 问题 , 找 准 其 中 的 平衡 点 是 很 具 艺 术 性 的 工作 , 也 是 构建 高 性 能 运行 
时 的 关键 所 在 。 假 如 现在 已 经 找到 了 这 个 平衡 点 ,例如 TRockit 是 通过 收集 所 有 相关 事件 的 运行 
时 反馈 信息 来 制定 决策 的 ， 那么 自 适应 运行 时 环境 就 能 达到 比 静 态 运 行 环境 更 高 的 执行 性 能 。 
































































































































2.5 深入 JIT 编译 器 


事实 上 ， 如 何 将 字 节 码 编译 为 本 地 代码 在 JVM 中 运行 , 与 如 何在 JVM 中 高 效 地 执行 代码 完 
全 是 两 回 事 ， 而 提高 代码 的 执行 效率 也 是 近 40 年 来 专家 学 者 深入 研究 编译 器 技术 〈 顺带 研究 了 
下 Java 语言 ) 的 主要 目标 。 本 节 将 介绍 JIT 编译 器 如 何 将 字 节 码 编译 为 高 效 的 本 地 代码 。 










































































2.5.1 ”处 理 字 节 码 


通常 来 说 ， 编 译 带 首先 要 处 理 的 是 源 代码 文件 ， 而 对 于 JVM 中 的 JIT 编译 器 来 说 ， 它 所 要 
处 理 的 是 字 节 码 ， 相 对 来 说 更 低级 一 些 ， 与 汇编 语言 有 点 像 。JIT 编译 器 的 前 端的 功能 与 C++ 编 
译 需 的 前 端 类 似 , 主要 对 平台 无 关 的 字 节 码 执行 格式 解析 和 词法 分 析 , 因此 这 部 分 功能 可 以 在 所 
有 架构 平台 中 重用 。 

尽管 字 节 码 听 起 来 比较 低级 , 但 其 实 具 有 非常 不 错 的 格式 , 有 效 地 将 代码 ( 操作 ) 和 数据 ( 操 
作 数 和 常量 池 ) 区 分 开 。 对 于 编译 器 前 端 来 说 ， 与 其 说 是 解析 二 进 制 的 可 执行 文件 ， 倒 不 如 说 解 
析 字 节 码 并 将 之 转换 为 程序 描述 ， 这 部 分 工作 与 编译 Java 或 C++ 源 代 码 非常 相似 。 其 实 可 以 将 
字 节 码 视 为 另 一 种 形式 的 源 代 码 ,一 种 结构 化 的 程序 描述 。 相 比 于 普通 源 代 码 ,， 字 节 码 对 程序 的 
描述 简单 明了 ， 更 便于 编译 带 分 析 ， 例 如 编译 带 可 以 很 容易 地 推断 出 操作 数 的 实际 类 型 。 

但 是 , 字 节 码 也 使 编译 右 开 发 者 的 工作 更 加 复杂 ， 从 某 种 程度 上 说 ,将 字 节 码 编译 为 本 地 代 
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码 比 直接 编译 普通 源 代码 难得 多 。 

其 中 的 一 个 问题 就 是 如 何 处 理 JVM 规范 中 所 规定 的 操作 数 栈 。 正 如 前 面 看 到 的 ， 大 多 数字 
节 码 操作 都 会 将 操作 数 从 栈 中 弹出 ， 完 成 操作 后 再 将 结果 和 人 栈 。 但 在 现实 中 , 没有 哪 种 平台 是 基 
于 栈 运行 的 ， 相 反 都 是 使 用 寄存 器 来 存储 中 间 结 果 的 。 将 局 部 变量 映射 到 本 地 寄存 器 比较 容易 ， 
但 将 操作 数 栈 映射 到 寄存 器 却 比较 复杂 。 此 外 ，Java 中 还 定义 了 很 多 虚拟 寄存 器 、 局 部 变量 , 但 
都 需要 通过 操作 数 栈 才能 使 用 。 在 这 一 点 上 确实 不 太 有 效率 , 有 人 会 有 疑问 , 已 经 有 这 么 多 虚拟 
寄存 吉 了 ， 为 什么 非得 使 用 操作 数 栈 ， 为 什么 执行 ada 操作 时 不 能 直接 执行 x=y+z， 而 非得 要 
使 用 push y,push z,add,pop x 这样 的 形式 ? 很 明显 ， 如 果 寄 存 器 够 用 的 话 ， 使 用 第 一 种 方 
式 会 简单 许多 。 

事实 上 ， 当 需要 将 字 节 码 编译 为 本 地 代码 时 ， 对 操作 数 栈 的 处 理 是 比较 复杂 的 。 为 了 能 够 重 
构 表 达 式 ， 例 如 执行 加 法 操作 的 表达 式 ， 必 须 始终 保持 对 操作 数 栈 进 行 操作 的 可 行 性 。 

另 一 个 问题 是 ， 字 节 码 自身 的 表达 能 力 是 强 于 Java 源 代码 的 ， 见 下 图 ， 极 少数 情况 下 这 可 
能 是 一 个 优势 。 当 涉及 可 移植 性 时 ( 字 节 码 可 以 由 任意 JVM 执行 )， 这 确实 挺 好 ， 而 且 字 节 码 格 
式 和 Java 源 代码 的 分 离 使 开发 人 员 可 以 为 其 他 语言 编写 相关 的 编译 器 ,使 其 能 够 运行 在 JVM E, 
这 在 早期 对 Java 的 推广 也 起 到 了 一 定 的 推动 作用 。 然 而 ， 从 其 他 环境 自动 生成 字 节 码 的 情况 比 
较 少 见 ， 的 确 有 一 些 产 品 可 以 将 其 他 语言 转换 为 字 节 码 , 但 使 用 得 并 不 广泛 。 当 需要 生成 字 节 码 
时 , 业界 更 倾向 于 将 其 他 语言 先 转换 为 Java, 再 编译 Java 代码 为 字 节 码 。 而 且 , 自动 生成 的 Java 
源 代码 的 结构 往往 和 编译 后 的 Java 源 代码 几乎 一 致 。 






























































































































































Java 字 节 码 表达 能 力 
的 范畴 





Java 源 代码 表达 能 力 的 范畴 











由 于 字 节 码 的 表达 能 力 更 强 ，JVM 规范 中 添加 了 字 节 码 校 验 (bytecode 
verification ) 这 个 步骤 。 每 种 JVM 实现 都 需要 检查 要 运行 的 字 节 码 中 是 否 存 在 
恶意 技巧 ， 例 如 直接 跳 转 到 方法 外 ， 履 盖 操 作 数 栈 ， 或 者 创建 递归 子 函 数 等 。 











尽管 字 节 码 的 可 移植 性 和 交叉 编译 的 能 力 广 受 好 评 , 但 也 导致 了 其 他 问题 的 出 现 , 其 根源 就 

在 于 字 节 码 中 允许 存在 非 结 构 化 控制 流 (unstructured control flow )， 例 如 字 节 码 中 可 以 使 用 goto 

令 跳 转 到 任意 标签 处 ， 而 在 Java 中 这 是 不 允许 的 。 因 此 ， 开 发 人 员 可 以 创造 出 无 法 用 Java 源 

代码 表示 的 字 节 码 结构 。 

这 就 导致 了 一 些 问 题 的 发 生 ， 例 如 对 于 无 法 用 Java 源 代码 表示 的 字 节 码 结构 ， 该 如 何 使 用 
Java JAAT? 
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在 字 节 码 中 存在 以 下 几 种 无 法 与 Java 源 代 码 对 应 的 情况 。 

口 可 以 使 用 goto 指令 从 循环 体外 不 经 过 循环 头 直接 跳 人 到 循环 体内 部 〈 不 可 规约 流 图 ， 
irreducible flow graph )， 这 种 方式 在 Java 中 是 被 禁止 的 。 对 于 优化 编译 器 来 说 ,不 可 规约 
流 图 是 一 大 障碍 。 

口 可 以 将 catch 语句 块 放 到 其 对 应 的 try 语句 块 中 ， 这 在 Java 中 是 不 允许 的 。 

a 可 以 在 一 个 方法 中 获取 锁 ， 而 在 另 一 个 方法 中 将 其 释放 ， 这 同样 也 是 被 Java 禁止 的 。 第 
4 章 将 对 此 深入 讨论 。 

字 节 码 混 满 
字 节 码 比 Java 源 代码 表达 能 力 强 所 带 来 的 问题 其 实 更 加 复杂 。 这 些 年 来 ， 市 面 出 现 了 各 种 

类 型 的 字 节 码 混 消 器 ， 均 承诺 可 以 防止 Java 源 代 码 汇 漏 。 但 实际 上 ， 这 根本 是 不 可 能 的 ， 正 如 

之 前 提 到 的 , 字 节 码 中 的 操作 代码 和 操作 数据 有 着 严格 的 界限 。 传 统 的 反 破 解 技术 是 通过 混 消 代 

码 和 数据 来 使 竞争 对 手 无 法 找到 破解 的 关键 位 置 的 ， 这 对 于 诸如 .exe 这 种 数据 和 代码 的 界限 不 

太 分 明 的 本 地 二 进 制 可 执行 文件 和 人 允许 自修 改 代 码 的 情况 是 比较 有 效 的 , 但 对 字 节 码 来 说 没什么 

用 。 所 以 ， 只 要 对 手 有 足够 的 决心 ， 就 没什么 Java 程序 不 能 破解 。 

不 同 于 混淆 数据 和 代码 这 样 的 技术 , 字 节 码 混淆 使 用 一 些 其 他 方法 , 通常 是 命名 混淆 (name 
mangling ) 和 控制 流 混淆 (control flow obfuscation )。 
命名 混淆 是 指 混淆 器 将 程序 中 所 有 的 变量 名 、 属 性 名 和 方法 名 重新 命名 , 使 用 短 且 难以 理解 

的 字符 串 蔡 换 原 命名 ， 例 如 使 用 a、a_ 和 a (有 时 甚至 是 无 法 理解 的 Unicode 字符 串 ) 来 替换 

类 似 get Password、setPassword 和 decrypt Password 这 些 有 业务 意义 的 名 字 。 混淆 后 的 代 

码 使 人 难以 理解 ， 无 法 通过 方法 名 和 属性 名 获取 有 效 信息 ， 从 而 加 大 了 破解 难度 。 不 过 ,对 于 编 

译 右 开发 者 来 说 ,命名 混淆 不 算 什么 大 问题 ， 因 为 控制 流 并 未 改变 。 

控制 流 混淆 是 指 如 果 字 节 码 混淆 器 能 够 生成 Java 中 禁止 出 现 的 非 结构 化 控制 流 ， 那 么 破解 

起 来 就 会 困难 得 多 ,可 以 防止 反 编译 器 通过 字 节 人 码 重 构 出 源 代码 。 但 很 不 垃 ， 这 项 技术 通常 会 导 

致 优化 编译 器 花费 不 必要 的 精力 来 重 构 控 制 流 信息 。 有 时 候 ,， 甚 至 根本 无 法 重 构 控 制 流 ， 从 而 无 

法 执行 相关 优化 ， 降 低 了 程序 执行 性 能 。 因 此 ， 应 避免 使 用 这 项 技术 。 


2.5.2 FPB “RRE” 


市 面 上 仍 有 各 种 各 样 的 字 节 码 优化 器 ,在 Java 诞生 之 初 尤 其 受 欢 迎 ， 即 使 到 现在 也 仍 不 时 
可 以 见 到 。 字 节 码 优化 顺 声 称 可 以 将 字 节 码 重 构 为 更 有 执行 效率 的 形式 ， 例 如 , 对 2 的 老 数 做 除 
法 可 以 转化 为 移 位 操作 ， 或 者 反 转 循环 以 节省 一 个 goto 指令 的 执行 。 

事实 上 , 在 现代 JVM 中 , 无 法 证 明 运行 经 过 “优化 ”的 字 节 码 能 够 比 直 接 运 行 javac 编译 后 
的 字 节 码 更 有 效率 。 现 代 JVM 中 已 经 包含 了 能 够 很 好 地 完成 优化 代码 工作 的 代码 生成 顺 ， 即 使 
字 节 码 看 起 来 比较 低级 ， 但 对 SVM 却 很 友好 。 在 将 字 节 码 编译 为 本 地 代码 的 过 程 中 ， 任 何在 字 
节 码 层级 所 做 的 优化 都 可 能 会 被 多 次 转化 为 其 他 形式 。 

我 们 从 未 见 过 有 用 户 声 称 使 用 字 节 码 优化 器 能 够 得 到 更 好 的 执行 效率 的 例子 ， 却 经 常 看 到 
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由 于 使 用 了 字 节 码 优化 器 而 导致 程序 运行 时 与 预期 不 同 , 或 是 在 不 同 JVM 上 出 现 不 同 的 行为 的 
案例 。 

因此 ， 我 们 的 建议 是 ， 不 要 使 用 字 节 码 优化 器 ， 任 何 情况 下 都 不 要 用 ! 

抽象 语法 树 

正如 前 面 提 到 的 , 字 节 码 的 优势 和 劣势 都 很 明显 。 我 们 认为 将 字 节 码 看 作 序 列 化 的 源 代 码 比 
较 好 , 不 应 该 将 之 当 作 低级 汇编 语言 ， 运 行 起 来 非得 越 快 越 好 。 在 解释 器 中 ， 字 节 码 的 性 能 确实 
有 问题 ,但 也 不 用 过 分 夸大 ,因为 解释 执行 本 身 就 挺 慢 。 性 能 优化 的 事情 会 在 后 面 的 代码 流水 线 
中 完成 。 





























尽管 字 节 码 具 有 紧凑 和 可 移植 性 的 特点 ,但 也 因 其 强大 的 表达 能 力 而 引入 了 
GS 不 少 问题 。 它 包含 了 一 些 低级 结构 ， 例 如 goto 指令 、 条 件 跳 转 指令 ， 其 至 是 
jsr 指令 ( 跳 转 到 子 函 数 ， 用 于 实现 finally 语句 块 ) 但 到 Java 1.6 时 ，javac 

和 大 多 数 其 他 Java 编译 器 都 已 经 将 子 函 数 内 联 到 当前 函数 中 了 。 





在 将 字 节 码 编译 为 本 地 代码 时 ， 不 能 简单 地 认为 字 节 码 是 编译 后 的 Java 源 代 码 ， 需 要 考虑 
各 种 可 能 的 情况 。 通 常 ， 编 译 器 前 端 读 和 人 源 代 码 (可 能 是 Java、C++ 或 其 他 什么 的 ) 并 执行 词法 
分 析 , 构建 抽象 语法 树 ( abstract syntax tree, AST ), 干净 的 抽象 语法 树 中 , 控制 流 都 是 结构 化 的 ， 
不 存在 任意 跳 转 的 goto 指令 ， 而 是 以 顺序 语句 、 表 达 式 和 迭代 ( 循环 节点 ) 来 表示 源 代码 的 结 
构 ， 而 且 对 AST 执行 中 序 凯 历 就 可 以 重 构 应 用 程序 。 相 比 于 字 节 码 ，AST 这 种 表示 方式 有 许多 
优点 。 
以 下 面 的 代码 为 例 ， 该 函数 用 于 计算 数组 中 元 素 之 和 ; 
public int add(int [] series) { 
int sum = 0; 
for (int i = 0; i < series.length; i++) { 
sum += series[i]; 
} 


return sum; 


} 
在 将 之 转换 为 字 节 码 时 ， 编 译 器 javac 通常 会 创建 一 个 类 似 于 下 图 所 示 结 构 的 抽象 语法 树 。 
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序列 
pody 
到 循环 返回 
sum 0 = sum 
init 
I 0 
cond z S 
Í length sum | + 
| 
Series K 
sum | aload 
series I | 
iter 一 
I + 
i 




















为 了 优化 代码 , 必须 要 满足 一 些 先 决 条 件 , 例如 识别 循环 不 变量 和 循环 体 需 要 对 控制 流 图 做 
上 象 语 法 树 中 就 比较 容易 ， 因 为 循环 已 经 隐 式 地 表示 出 来 了 。 

但 为 了 生成 字 节 码 ， 可 能 要 将 Java 编译 需 生 成 的 抽象 语法 树 中 已 经 用 循环 节点 表示 出 来 的 
日 条 件 跳 转 和 非 条 件 跳 转 来 表示 : 


一 些 比较 复杂 的 分 析 ， 而 在 提 


结构 化 循环 拆散 ， 使 月 


public int add(int[]); 


Code: 
0: 


Sn UP WD PE 





iconst_0 


: istore_2 

: iconst_0 

: istore_3 

: iload_3 

: aload 1 

: arraylength 
: if_icmpge 22 

















//sum=0 


//i=0 
//loop_header: 





//if (i>=series.length) then goto 22 
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10: iload_2 
11: aload_1 
12: iload_3 


13: iaload 

14: iadd 

15: istore_2 //sum += series[i] 
16: iinc 35, 4 //i++ 

19: goto 4 //goto loop header 
22: iload_2 

23: ireturn //return sum 








现在 ， 由 于 没有 了 结构 化 控制 流 信 息 ， 字 节 码 编译 器 不 得 不 花费 额外 的 CPU 资源 来 重 构 控 
制 流 信息 ， 有 些 时 候 甚 至 根本 无 法 恢复 这 些 信息 。 

现在 回想 起 来 ， 当 初 在 设计 JVM 时 就 直接 使 用 经 过 编码 的 AST 作为 字 节 码 格式 的 话 ， 可 能 
会 是 更 好 的 选择 。 不 少 学 术 论 文中 谈 到 AST 的 压缩 效果 不 撑 于 字 节 码 ， 其 至 可 以 更 好 ， 所 以 空 






























































在 最 初 的 JRockit JIT 编译 器 中 ,使 用 的 是 一 个 反 编译 前 端 ， 试 图 通过 字 节 

Sh. Stee ee Se E et 

> 建 AST 的 工作 困难 重重 ,因此 这 个 反 编译 器 在 21 世纪 初 就 被 废弃 了 ， PRAT 
以 直接 从 字 节 码 的 任意 控制 流 中 创建 出 控制 流 图 的 统一 前 端 。 


2.5.3 ”优化 字 节 码 


程序 员 往 往 会 过 早 地 优化 其 Java 代码 ， 这 完全 可 以 理解 。 你 怎么 能 放心 地 将 优化 Java 源 代 
码 的 任务 交 给 JVM 这 个 黑 盒 来 完成 呢 ? 当然 ， 就 某 些 方面 来 说 的 确 是 这 样 , 但 即使 JVM 无 法 完 
全 理解 应 用 程序 的 意图 ， 它 仍然 可 以 依据 收集 到 的 信息 来 完成 很 多 优化 工作 。 

有 时 候 ， 对 于 自 适 应 优化 后 的 程序 如 此 高 效 ， 人 们 还 觉得 挺 惊讶 。 但 这 其 实 很 简单 ， 因 为 在 
运行 时 环境 中 ，JVM 能 够 更 好 地 检测 出 应 用 程序 的 运行 模式 ， 从 而 加 以 优化 。 另 一 方面 ， 某 些 
因素 使 得 应 用 程序 的 某 些 方面 更 适合 人 工 优化 。 本 书 并 非 想 表达 “所 有 代码 优化 工作 都 应 该 交 由 
JVM 完成 ”这 样 的 观点 ， 但 是 正如 前 文 提 到 的 ， 不 应 该 在 字 节 码 层级 做 优化 。 

要 写 出 高 性 能 的 应 用 程序 ， 只 靠 JVM JIT 编译 器 优化 是 不 行 的 。 例 如 ，JVM 没 法 将 2 次 方 
复杂 度 的 算法 优化 成 线性 复杂 度 ， 不 会 将 程序 员 写 的 冒 泡 排序 (bubble sort) 替换 成 快速 排序 
(quick sort )， 也 不 会 自动 实现 一 个 应 由 开发 人 员 实 现 的 对 象 缓存 系统 ， 像 这 样 的 例子 还 有 很 多 。 
JVM 不 是 万 能 的 ， 自 适应 优化 也 永远 不 会 将 烂 算 法 替换 成 好 算法 ， 它 顶 多 使 烂 算 法 运行 得 更 快 
一 些 而 已 。 

JVM 可 以 轻松 应 对 标准 面向 对 象 代码 中 的 很 多 结构 。 避 人 免 声 明 额 外 变量 ,或 者 直接 访问 成 
员 属 性 而 不 是 调用 getter 或 setter 等 方法 对 程序 员 其 实 没什么 帮助 , 而 且 这 些 粗浅 的 优化 并 
不 能 使 SIT 编译 器 优化 后 的 代码 运行 得 更 快 ， 反 而 可 能 会 使 Java 代码 的 可 读 性 变 差 。 

































































3 











22 第 2 章 自 适应 代码 生成 





有 些 时 候 ， 对 Java 源 代 码 做 优化 会 适得其反 。 绝 大 部 分 写 出 可 读 性 很 差 的 

代码 的 人 都 声称 是 为 了 优化 性 能 ， 其 实 就 是 照 着 一 些 基 准 测 试 报告 的 结论 写 代 

码 ， 而 这 些 性 能 测试 往往 只 涉及 了 字 节 码 解 释 执行 ， 没 有 经 过 JIT 编译 器 优化 ， 

所 以 并 不 能 代表 应 用 程序 在 运行 时 的 真实 表现 。 例 如 , 某 个 服务 器 端 应 用 程序 中 

过 人 包含 了 大 量 对 数组 元 素 的 迭代 访问 操作 , 程序 员 参 考 了 那些 报告 中 的 结论 , 没有 
S 设置 循环 条 件 ， 而 是 写 一 个 无 限 for MAR, ET try 语句 块 中 ,并 在 catch 语 
句 块 中 捕获 ArrayIndexOutOfBoundsException 骨 常 。 这 种 糟糕 的 写法 不 仅 

使 代码 可 读 性 极 差 , 而且 一 旦 运行 时 对 之 优化 编译 的 话 ， 其 执行 效率 反而 比 普通 

循环 方式 低 得 多 。 原 因 在 于 ，JVM 的 基本 假设 之 一 就 是 “异常 是 很 少 发 生 的 ”。 

基于 这 种 假设 , JVM 会 做 一 些 相关 优化 , 所 以 当真 的 发 生 异 常 时 ,处理 成 本 就 很 高 。 























当 读者 在 排查 性 能 瓶颈 时 ,应 该 清楚 地 知道 相关 监控 指标 的 真正 含义 ， 以 免 被 误导 。 不 是 所 
有 的 问题 都 可 以 通过 一 个 小 型 的 、 自 包含 的 基准 测试 来 排查 的 , 也 不 是 每 个 基准 测试 都 能 准确 反 
映 出 问题 的 本 质 。 第 5 章 将 会 详细 介绍 基准 测试 的 相关 内 容 ， 以 及 如 何 测 试 Java 应 用 程序 的 性 
能 。 本 书 的 第 2 部 分 介绍 了 JRockit Mission Control 套件 的 各 个 组 件 ， 这 些 组 件 是 做 性 能 分 析 的 
理想 工具 。 


2.6 ”代码 流水 线 


假设 JIT 编译 需 前 端 已 经 完成 对 字 节 码 的 处 理 , 将 之 转换 为 另 一 种 更 便于 处 理 的 中 间 格 式 了 ， 
那 接 下 来 该 干什么 ? 通常 情况 下 , 代码 会 经 过 几 次 不 同 层级 的 转换 和 优化 , 其 中 的 每 一 次 转换 都 
增强 了 代码 的 平台 相关 性 。 最 终 ， 生 成 的 本 地 代码 会 被 放 到 代码 缓冲 区 中 ， 以 备 调 用 。 

一 般 来 说 , 会 尽 可 能 地 保持 JIT 编译 器 的 可 移植 性 。 因 此 ， 大 部 分 优化 工作 都 是 在 代码 还 具 
有 平台 无 关 性 时 完成 的 ， 这 样 便于 将 JIT 编译 圳 移植 到 其 他 平台 上 。 但 是 ,为 了 达到 工业 级 性 能 
要 求 ， 低 级 的 、 平 台 相关 的 优化 工作 还 是 要 完成 的 。 

本 方 会 详细 介绍 JIT 编译 需 如 何 将 字 节 码 编译 为 本 地 代码 ， 以 及 其 中 涉及 的 不 同 阶段 。 虽 然 
这 部 分 是 以 JRockit JIT 编译 器 为 例 介 绍 的 , 但 生成 本 地 代码 的 整个 过 程 也 适用 于 其 他 JVM 实现 。 


2.6.1 为 什么 JRockit 没有 字 节 码 解释 器 


JRockit JVM 所 使 用 的 代码 生成 策略 是 完全 JIT 编译 。 

1998 年 JRockit 项 目 刚 刚 发 起 时 , 架构 师 们 意识 到 Java 纯 服 务 器 端 应 用 程序 的 开发 是 一 块 未 
被 发 掘 的 市 场 ， 因 此 JRockit 在 设计 之 初 就 被 定位 为 一 款 服 务 器 端 JVM。 大 多 数 服 务 器 端 应 用 程 
序 的 运行 时 间 很 长 , 对 于 达到 服务 稳定 运行 所 需 的 时 间 有 一 定 要 求 , 因此 对 于 只 在 服务 器 上 运行 
的 JVM 来 说 ， 程 序 的 运行 效率 比 代码 生成 时 间 更 重要 。 这 为 我 们 省 了 不 少 事 ， 既 不 用 操心 解释 
器 和 JIT 编译 器 的 实现 ， 也 不 用 管 代 码 在 二 者 之 间 的 切换 。 

人 们 很 快 注意 到 ， 将 每 个 方法 都 编译 一 遍 会 大 大 延长 启动 时 间 。 起 初 ， 这 不 是 什么 大 问题 ， 
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因为 服务 器 端 应 用 程序 在 启动 之 后 就 会 持续 运行 很 长 时 间 。 

后 来 ，JRockit 因 其 高 性 能 而 成 为 一 款 主流 JVM， 修 改 代码 流水 线 使 其 满足 客户 端 和 服务 器 
端 不 同 需 求 的 呼声 日 益 高 涨 。 但 即便 如 此 ，JRockit 也 没有 为 此 去 实现 字 节 码 解释 器 ， 而 是 修改 
了 JIT 编译 器 ,使 其 进一步 区 别 对 待 热 方法 和 冷 方 法 ,第 一 次 调用 某 个 方法 时 能 够 更 快速 地 编译 
一 个 优化 程度 不 高 的 版 本 出 来 。 此 举 大 大 加 快 了 应 用 程序 的 启动 速度 , 但 和 使 用 解释 器 的 启动 速 
度 相 比 还 是 有 些 差距 的 。 

另 一 方面 ， 在 开发 过 程 中 ， 解 释 器 具有 更 强 的 可 调试 性 ( debuggability )， 更 便于 调试 Java 
源 代码 。 字 节 码 中 包含 了 诸如 变量 名 和 行 号 等 元 信息 ， 方 便 调 试 器 定位 。 为 了 支持 调试 功能 ， 
JRockit 不 得 不 在 编译 字 节 码 到 本 地 代码 的 过 程 中 始终 附带 着 这 些 信息 ， 但 解决 了 元 信息 的 短 记 
问题 之 后 ， 也 就 没 必 要 再 添加 解释 器 了 。 就 我 们 所 知 ， 耻 ockit 也 是 唯一 一 款 人 允许 用 户 调试 优化 
后 代码 的 虚拟 机 。 

JRockit 纯 编 译 策略 的 一 个 主要 问题 是 ， 代 码 膨 胀 〈 可 以 通过 对 代码 缓冲 区 中 的 无 用 代码 执 
行 垃圾 回收 来 解决 ) 和 大 方法 编译 时 间 过 长 ( 可 以 通过 让 JIT 编译 器 先生 成 优化 程度 不 高 的 编译 
版 本 来 解决 )。 


































































































某 些 情况 下 ， 纯 编译 策略 的 伸缩 性 不 太 好 。 例 如 ，JRockit 有 时 候 需 要 使 用 
> 较 长 的 时 间 来 编译 一 个 较 大 的 方法 ， 典 型 情况 是 编译 JSP 文件 。 不 过 , 一 旦 编译 
完成 ， 访 问 该 JSP 的 相应 时 间 会 比 解释 执行 要 短 。 
如 果 在 使 用 JRockit 时 ， 遇 到 了 代码 生成 的 相关 问题 ， 请 参考 2.7 节 中 介绍 
的 方法 处 理 。 


2.6.2 启动 


JRockit JVM 的 核心 是 其 运行 时 系统 , 它 持 续 跟 踪 其 虚拟 执行 环境 中 各 组 成 部 分 的 变化 情况 ， 
把 控 代 码 生成 器 编译 方法 的 时 机 和 优化 程度 。 

简单 来 说 ， 启 动 SVM 时 首先 要 做 的 就 是 跳 转 到 Java 应 用 程序 的 main 方法 ， 这 是 通过 JVM 
的 标准 JNI 调 用 完成 的 ， 就 像 其 他 本 地 应 用 程序 通过 JNI 执行 Java 代码 一 样 。 

启动 JVM 方法 的 过 程 涉 及 一 系列 复杂 的 操作 和 对 相关 依赖 的 处 理 ， 会 调用 很 多 其 他 Java 方 
法 。 此 外 ， 为 了 解析 main 方法 ， 还 会 生成 一 些 JVM 内 部 函数 。 最 后 ， 当 做 好 准备 ， 并 已 经 将 
main 函数 编译 为 本 地 方法 时 , JVM 就 可 以 开始 执行 第 一 个 其 本 地 代码 到 Java 代码 的 存根 , 并 将 
控制 权 从 JVM 移交 给 Java 程序 。 























要 想 更 好 地 理解 JRockit 的 启动 过 程 ， 可 以 在 命令 行 中 使 用 -Xverbose: 

codegen 选项 执行 Java 程序 ,于 是 你 会 看 到 ,即便 是 运行 一 个 简单 的 Hello World 

程序 ， 也 需要 编译 将 近 1000 个 方法 ， 不过， 所 需 的 时 间 并 不 长 。 在 Intel Core2 
机 器 上 ， 总 体 代 码 生 成 时 间 不 超过 250 毫秒 。 





24 第 2 章 自 适应 代码 生成 





2.6.3 ”运行 时 代码 生成 


使 用 完全 JIT 编译 策略 时 需要 注意 延迟 编译 的 处 理 。 如 果 以 深度 优先 的 方式 编译 完 所 有 方法 
的 话 , 时 间 消 耗 过 大 ,而 且 引 用 类 时 没 必要 立即 编译 类 中 的 所 有 方法 ,因为 其 中 的 方法 有 可 能 一 
个 都 不 会 被 调用 。 此 外 ，Java 程序 的 控制 流 在 执行 的 时 候 有 可 能 会 选择 一 条 不 同 的 执行 路 径 。 很 
明显 , 这 对 使 用 混合 编译 模式 的 JVM 来 说 不 是 个 问题 , 因为 其 中 的 所 有 方法 都 是 先 解释 执行 的 ， 
无 须 提前 编译 。 

1. 跳板 

针对 上 面 提 到 的 问题 ，JRockit 的 解决 方案 是 ， 被 调用 的 方法 在 还 没有 生成 本 地 代码 之 前 ， 
先生 成 一 份 存根 代码 (stub code )， 即 跳板 (trampoline )， 其 中 包含 了 几 行 临时 代码 。 当 该 方法 首 
次 被 调用 时 ， 会 跳 转 到 跳板 处 执行 ， 而 它 的 任务 就 是 通知 JRockit 要 为 该 方法 生成 本 地 代码 。 代 
码 生成 器 处 理 该 请 求 ,并 返回 生成 的 代码 的 起 始 地 址 ， 然 后 跳板 再 跳 转 到 具体 地 址 开始 执行 。 对 
用 户 来 说 ， 看 起 来 就 像 是 直接 调用 Java 方法， 但 实际 上 它 是 在 首次 调用 时 才 生 成 的 。 

















































































































0x1000: method A 0x3000: method C 
call method B @ 0x2000 call method B @ 0x2000 


0x2000: method B (trampoline) 0x4000: The "real" method B 
call JVM.Generate(B) -> start Tax 
write trap @ 0x2000 
goto start @ 0x4000 


在 上 面 的 例子 中 ， method A 的 起 始 地 址 在 0x1000 它 在 调用 method B 时 以 为 其 起 始 地 
址 是 ox2000， 这 时 method B 第 一 次 被 调用 。0x2000 位 置 处 的 存根 代码 就 是 跳板 ， 它 会 发 起 
一 个 本 地 调用 ， 告 知 JVM 要 为 method B 生成 代码 。 此 时 ， 程 序 会 一 直 等 待 ， 直 到 代码 生成 器 
完成 工作 ， 并 返回 method B 的 真正 地 址 ， 假 设 是 0x4000， 再 跳 转 到 该 地 址 开始 执行 。 
注意 ， 对 method B 的 调用 可 能 会 有 多 处 ， 即 都 指向 跳板 的 地 址 0x2000。 例 如 上 面 例子 中 
method C。 这 些 对 method B 的 调用 应 该 修改 为 真正 的 method B 的 地 址 ， 而 不 是 每 次 都 重新 
生成 一 遍 method Bo JRockit 的 解决 办 法 是 ， 当 跳板 运行 过 一 次 之 后 ， 在 0x2000 处 写 和 人 一 个 陷 
阱 指令 ， 如 果 跳 板 再 被 调用 ，JRockit 中 一 个 特殊 的 异常 处 理 器 会 捕获 到 该 事件 ， 并 将 调用 指向 
真正 的 method B, 使 对 method B 的 调用 从 原 地 址 0x2000 指向 其 新 的 地 址 0x4000。 这 个 过 
程 称 为 回填 (back patching )。 

不 仅 是 方法 生成 ,回填 技术 常用 于 虚拟 机 的 各 种 代码 替换 操作 。 例 如 ， 当 某 个 热 方 法 被 重新 
编译 为 更 高 效 的 版 本 时 ， 就 是 在 该 方法 的 之 前 版 本 的 起 始 位 置 上 设置 一 个 陷阱 (trap )， 当 再 次 调 
用 该 方法 时 会 触发 异常 ， 虚 拟 机 捕获 到 该 异常 后 会 将 调用 指向 新 生成 的 代码 的 位 置 。 

注意 , 这 只 是 个 不 得 已 的 办 法 ,因为 我 们 没有 足够 的 时 间 遍 历 所 有 已 经 编译 过 的 代码 去 查找 
所 有 需要 更 新 的 调用 。 

当 没 有 任何 引用 指向 某 个 方法 的 老 的 编译 版 本 时 , 该 版 本 就 可 以 由 运行 时 系统 回收 掉 , 释放 
内 存 资源 。 这 对 于 使 用 完全 JIT 编译 策略 的 JVM 来 说 非常 重要 ， 因 为 编译 后 的 代码 量 非 常 大 ， 
要 避免 出 现 内 存 耗 尽 的 情况 。 













































































































































































2.6 代码 流水 线 25 





2. 代码 生成 请 求 

在 JRockit 中 ， 当 某 个 方法 需要 执行 JIT 编译 时 ， 运 行 时 系统 会 向 代码 生成 需 发 出 代码 生成 
请 求 (code generation request )， 这 种 请 求 分 为 同步 和 异步 两 种 类 型 。 

同步 代码 生成 请 求 包括 : 
O 以 指定 的 优化 等 级 ， 为 执行 JIT 编译 而 生成 方法 
口 以 指定 的 优化 等 级 ， 编 译 已 经 生成 的 方法 
































异步 代码 生成 请 求 是 指 : 

o 当 某 些 前 提 假 设 失效 时 重新 生成 代码 ， 例 如 强制 为 某 个 方法 重新 生成 代码 ， 或 者 为 某 个 
方法 的 本 地 代码 打 补 丁 

从 内 部 实现 上 讲 ，JRockit 按照 不 同 的 请 求 类 型 ， 将 同步 代码 生成 请 求 保存 在 代码 生成 队列 


(code generation queue ) 或 代码 优化 队列 (code optimization queue ) 中 。 根 据 不 同 的 系统 配置 ， 
可 能 会 使 用 一 个 或 多 个 线程 来 完成 代码 生成 或 代码 优化 的 请 求 。 

代码 生成 队列 中 的 请 求 除了 一 些 特殊 情况 ( 例如 在 启动 JVM 时 有 些 方法 要 直接 生成 本 地 
代码 )， 剩 下 的 都 是 跳板 发 起 的 代码 生成 请 求 。 这 些 代码 生成 请 求 会 阻塞 应 用 程序 的 执行 ， 直 
到 完成 代码 生成 ， 并 返回 生成 的 代码 在 内 存 中 的 位 置 ， 以 便 调用 方法 跳 转 到 新 生成 的 代码 的 正 
确 位 置 。 

3. 代码 优化 请 求 

当 JVM 发 现 某 个 方法 够 热 时 ， 也 就 是 运行 时 系统 发 现 已 经 用 了 足够 多 的 时 间 来 运行 某 个 方 
法 ， 应 该 优化 时 ， 会 发 起 一 个 优化 请 求 ， 添 加 到 优化 队列 中 。 

相 比 于 代码 生成 队列 来 说 ,优化 队列 的 运行 优先 级 较 低 ， 因 为 对 于 代码 执行 来 说 ， 它 并 不 是 
必需 的 ， 只 是 为 提高 性 能 而 存在 的 。 通 常 来 说 ,代码 优化 请 求 的 执行 时 间 会 比 代码 生成 请 求 高 几 
个 数量 级 ， 但 是 代码 优化 请 求 会 生成 执行 效率 更 高 的 代码 。 

4. ERR 

当 完 成 某 个 方法 的 优化 请 求 后 , 需要 替换 掉 该 方法 的 现存 版 本 。 正 如 前 面 提 到 的 , 会 使 用 陶 
SEE (trap instruction ) 覆盖 现存 版 本 的 方法 入 口 点 ,于 是 再 次 调用 该 方法 时 会 通过 回填 技术 指 
向 新 的 、 优 化 过 的 版 本 。 

当 JVM 发 现 应 用 程序 花费 了 大 量 时 间 来 执行 某 个 方法 时 ， 就 会 将 该 方法 标记 为 热 方法 ， 准 
备 优化 。 但 是 ， 当 某 个 方法 中 包含 了 需要 执行 很 长 时 间 的 循环 时 ， 尽管 仍 会 优化 该 方法 ， 并 在 该 
方法 的 老 版 本 的 方法 入 口 点 上 写 入 陷阱 指令 , 该 方法 的 老 版 本 却 仍 会 继续 执行 下 去 。 很 显然 , 在 
这 种 情况 下 ，JVM 为 该 方法 所 做 的 优化 想 生 效 就 只 能 等 待 对 该 方法 的 下 一 次 调用 ， 而 对 于 那些 
无 限 循环 来 说 ， 则 永远 不 会 生效 。 

有 些 优 化 器 会 在 方法 执行 过 程 中 , 使 用 优化 后 的 版 本 替换 掉 现 有 的 版 本 , 这 就 是 所 谓 的 栈 上 
替换 ( on-stack replacement, OSR )。 实 现 OSR 需要 额外 记录 大 量 信息 。 此 外 ， 尺 管 在 完全 JIT 
编译 策略 下 可 以 实现 OSR, 但 在 有 解释 器 辅助 的 环境 中 ， 实 现 起 来 更 容易 。 因 为 可 以 退化 为 解 
释 执行 ， 蔡 换 后 再 执行 编译 后 的 代码 。 

不 过 ,JRockit 中 并 没有 实现 OSR， 因 为 复杂 性 太 高 。 因 此 ， 即 使 已 经 生成 了 优化 后 的 方法 ， 
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还 是 要 等 下 一 次 调用 才 会 生效 。 

对 实际 使 用 情况 的 调研 表明 ， 舍 弃 OSR 并 没 对 性 能 有 很 大 影响 ， 唯 一 出 问题 的 场景 是 一 些 
写 得 比较 烂 的 基准 测试 程序 , 这 些 程序 将 主 方法 里 所 有 的 计算 都 放 在 了 一 个 大 循环 中 。 针 对 这 种 
问题 ,其 实 只 要 将 其 中 的 计算 操作 提出 来 放 到 一 个 单独 的 方法 中 ,循环 调用 就 可 以 了 。 在 第 5 章 
中 将 会 详细 讨论 有 关 基 准 测试 最 重要 的 方面 。 

5. Sie 

IVM 中 的 代码 生成 器 需要 做 很 多 与 运行 时 系统 相关 的 德 记 任务 。 

。 GC 所 需 的 对 象 信息 

出 于 多 种 目的 ， 垃 圾 回收 器 都 需要 在 程序 运行 的 任意 时 刻 清楚 地 知道 Java 对 象 分 布 在 哪些 
寄存 器 和 栈 帧 中 。 这 些 信息 由 JIT 编译 器 生成 ， 存 储 在 运行 时 系统 的 数据 库 中 。 之 所 以 由 JIT A 
译 器 生成 这 些 信息 ,是 因为 在 生成 代码 时 可 以 轻松 获得 类 型 信息 。 无 论 如 何 ,编译 器 都 要 处 理 类 
型 。 在 JRockit 中 ， 对 象 元 信息 被 称 为 存活 对 象 图 ， 第 3 章 将 详细 介绍 代码 生成 系统 如 何 与 垃圾 
回收 器 配合 工作 。 

。 源 代码 与 变量 信息 

短 记 系统 的 另 一 个 任务 是 要 始终 保存 源 代码 信息 ， 即 使 这 些 代码 已 经 被 编译 成 本 地 代码 
IVM 必须 能 够 从 正在 执行 的 任意 指令 回 湖 到 对 应 的 Java 源 代码 的 具体 位 置 。 为 了 能 够 完成 调试 
任务 ,支持 对 栈 中 的 内 容 进行 跟踪 ,甚至 是 包含 了 已 经 优化 过 的 代码 的 调用 栈 。 这 种 需求 使 实现 
更 加 复杂 ， 因 为 优化 器 可 能 会 将 方法 变 得 面目 全 非 ， 而 且 由 于 内 联 (inlining ) 的 存在 ， 一 个 方法 
中 可 能 还 包含 着 另 一 个 方法 。 即 使 某 个 高 度 优化 的 方法 中 抛 出 了 异常 ,那么 输出 的 调用 栈 信息 中 
也 必须 包含 正确 的 行 号 信息 。 

问题 本 身 并 不 难 解决 , 德 记 系统 其 实 就 是 一 种 数据 库 , 只 不 过 比较 大 、 比较 复杂 而 已 。JRockit 
在 运行 时 保存 了 绝 大 多 数 本 地 指令 与 Java 源 代码 的 映射 关系 ， 显 然 ， 相 比 于 解释 执行 ， 在 完全 
JIT 编译 策略 下 需要 做 更 多 的 工作 。 在 Java 字 节 码 格式 中 ， 局 部 变量 信息 和 行 号 信息 都 被 映射 存 
储 到 不 同 的 结构 中 ，JRockit 所 做 的 就 是 在 整个 运行 过 程 中 保存 住 这 些 映 射 信息 。 最 终 ， 每 个 字 
节 码 指令 都 会 被 转化 为 0 个 或 多 个 本 地 代码 指令 ， 这 些 指令 可 能 会 顺序 或 乱 序 执行 。 

。 代码 生成 所 涉及 的 前 提 假 设 

正如 前 面 讨论 的 ，JVM 中 的 一 些 前 提 假设 在 生成 代码 时 非常 重要 。 如 果 某 个 假设 条 件 被 打 
破 ， 就 需要 发 送 异步 请 求 ， 重 新 为 相关 方法 生成 代码 。 因 此 ， 这 些 前 提 假 设 也 是 JRockit 运行 时 
的 一 部 分 ， 与 代码 生成 器 密切 相关 。 


2.6.4 代码 生成 概述 


下 面 来 看 一 看 JRockit JIT 编译 器 如 何 将 Java- 方 法 编译 为 本 地 代码 ， 在 这 个 过 程 中 ， 编 译 需 
所 做 的 大 部 分 工作 与 其 他 JIT 编译 类 似 ( 其 实 和 其 他 静态 编译 器 也 是 类 似 的 )， 其 他 部 分 则 略 有 
不 同 。 不 过 最 后 结果 ， 生 成 的 本 地 代码 是 相同 的 。 

下 面 的 示例 代码 是 一 个 计算 MD5 值 的 哈 希 函数 ， 本 节 会 通过 将 该 函数 编译 为 本 地 代码 来 说 
明代 码 生 成 的 整个 过 程 。 
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public static int md5_F(int x, int y, int z) { 
return (x & y) | ((~x) & z); 


} 


1. 代码 的 中 间 表 示 

代码 生成 的 第 一 步 是 将 字 节 码 转 换 为 IR (intermediate representation， 中 间 表 示 )， 这 样 做 的 
目的 是 为 了 便于 优化 器 使 用 , 而且 其 他 语言 也 可 以 用 同一 种 编译 右前 端 处 理 , 为 了 方便 , 优化 器 
也 倾向 于 使 用 通用 的 内 部 中 间 格 式 。 

JRockit 中 使 用 的 中 间 表 示 与 字 节 码 略 有 不 同 ， 有 点 像 经 典 的 编译 器 教材 中 使 用 的 格式 。 大 
部 分 编译 器 都 这 么 干 ， 只 不 过 使 用 的 中 间 表 示 的 具体 格式 有 些许 差别 , 这 取决 于 具体 实现 和 要 编 
译 的 目标 语言 。 

除了 前 面 提 到 的 可 移植 性 问题 外 ， 还 有 两 个 问题 使 JRockit 在 这 一 阶段 不 会 对 字 节 码 的 内 容 
做 修改 ， 就 是 非 结 构 化 控制 流 和 运行 栈 模 型 ， 尤 其 是 运行 栈 模型 ， 它 与 任何 现代 的 硬件 寄存 器 模 
型 都 不 相同 。 

由 于 缺少 重 构 AST 的 完整 信息 ， 在 JRockit 中 ， 方 法 被 表示 为 一 个 有 向 的 控制 流 图 (control 
flow graph )， 其 节点 是 基本 块 (basicblock )。 在 这 里 ， 基 本 块 的 定义 是 ， 如 果 基 本 块 中 的 一 条 指 
令 得 以 执行 , 那么 该 基本 块 中 的 其 他 指令 也 会 被 执行 。 由 于 示例 方法 ma5_F 中 不 存在 分 支 语句 ， 
所 以 ，mqd5_F 可 以 被 转换 为 一 个 基本 块 。 

@ 数据 流 

基本 块 中 包含 0 个 或 多 个 带 有 操作 数 的 操作 。 操 作 数 可 以 是 其 他 操作 ( 形成 表达 式 树 ， 
formingexpression tree )、 变 量 ( 虚拟 寄存 器 或 原子 操作 数 )、 常 量 或 地 址 等 ,具体 内 容 视 中 间 表 
示 与 硬件 表示 的 紧密 程度 而 定 。 

o 控制 流 

基本 块 可 以 有 多 个 人口 和 出 口 ， 控制 流 图 中 的 边 表 示 控 制 流 。 任 何 控制 流 , 例如 直接 进入 下 
一 个 基本 块 、goto 指令 、 一 个 条 件 跳 转 、switcn 指令 或 异常 ， 都 会 在 控制 流 图 中 产生 一 条 或 
多 条 边 。 

当 控 制 流 遇 到 方法 时 ,会 生成 一 个 指定 的 起 始 基本 块 ( start basic block )。 没 有 出 口 的 基本 块 
用 于 结束 方法 执行 ， 这 样 的 基本 块 使 用 return 指令 或 throw 指令 结束 。 




















































































































o 异常 处 理 
控制 流 图 中 对 异常 的 表示 稍微 复杂 一 点 ， 需 要 生成 从 每 个 可 能 出 错 的 字 节 码 操 作 到 对 应 的 


catch 语句 块 的 条 件 跳 转 。 
这 样 做 的 结果 是 , 使 控制 流 图 中 基本 块 和 边 的 数量 呈 爆 发 性 的 增长 , 遍历 图 的 算法 的 复杂 度 
O(IVIIEI) 大 大 增加 。 因 此 ， 需 要 特殊 对 待 基 本 块 中 的 异常 。 
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代码 块 0 
2 and vi 1 ->v4 
1 cmp v4 0 





------ if != then block1, else block2 ----- 














| (ee | 












































代码 块 1 代码 块 2 | 
8 mul vi v2 ->v7 11 div vi v2 ->v7 
f v 代码 块 3 
代码 块 5 14 return -1 
16 return v7 






































上 图 展示 了 一 个 稍微 复杂 一 点 的 控制 流 图 。 方 法 的 入口 位 于 Block 0， 出 口 有 3 个 ，2 个 正 
AEO (条 件 分 支 ) 和 1 个 异常 处 理 。 这 就 是 说 ，Block 0 实际 上 是 一 个 try 语句 块 的 一 部 分 ， 
其 对 应 的 catch 语句 块 是 Block 3, M Block 1 M Block 2 也 是 这 个 try 语句 块 的 一 部 分 。 
退出 方法 可 以 通过 触发 异常 结束 于 Block 3, 或 者 一 直 正 常 执行 结束 于 Block 5, 最终 都 以 
return 指令 作为 结束 。 即 使 在 这 个 方法 中 可 能 会 触发 异常 指令 只 有 Block 2 中 的 div (BR 0 
触发 异常 )，try 语句 块 仍 会 跨越 多 个 节点 ， 因 为 字 节 码 就 是 这 么 写 的 ， 也 有 可 能 源 代码 就 写成 
这 样 。 优 化 右 可 以 在 后 续 的 动作 中 对 此 优化 。 

1. JIT 编译 

下 图 展示 了 源 代码 经 过 IRockit 代码 流水 线 处 理 的 几 个 不 同 阶 段 。 








































































字 节 码 到 高 高 级 中 间 表 示 到 
级 中 间 表 示 中 级 中 间 表 示 


中 级 中 间 表 示 到 
低级 中 间 表示 
























寄存 器 分 配 代码 发 射 

















e 高 级 中 间 表 示 (HIR) 

上 图 中 的 第 一 个 模块 Bc2HIR 是 处 理 字 节 码 的 编译 器 前 端 ， 用 于 快速 将 字 节 码 转 换 为 IRo 
XE, HIR 是 指 高 级 中 间 表 示 (high-level intermediate representation )。 示 例 函 数 ma5_F 中 不 存在 
条 件 跳 转 或 非 条 件 跳 转 ， 因 此 只 需 一 个 基本 块 就 可 以 完整 表示 出 来 。 

下 面 的 代码 是 编译 为 字 节 码 形式 的 mda5_F: 


public static int md5_F(int, int, int); 
Code: Stack contents: Emitted code: 






































0: iload _0 v0 

1: iload 1 v1 

2: iand (v0&v1) 

3: iload_0 (vO&v1), vO 

4: iconst_m1 (v0&v1), v0, -1 
5: ixor (v0&v1), (v0^-1) 
6: 


iload_2 (v0&v1), (v0^-1), v2 
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7: iand (vO&V1), ((v0%-1) & v2) 
8: ior ((v0&v1) | ((v0O4-1) & v2)) 
9: ireturn return ((v0&v1) | 


((v04-1) & v2)); 
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AILAI, 这 些 代码 是 通过 模拟 程序 运行 时 操作 数 栈 中 的 内 容 生 成 的 。 通过 上 面 的 示例 代码 可 以 
AP, 随 着 JVM 对 不 同 字 节 码 指令 的 执行 ,操作 数 栈 的 内 容 不 断 变化 ,并 最 终 影 响 到 生成 的 代码 。 


| 县 i 由 于 字 节 码 中 没有 位 操作 符 ， 所 以 javac 在 实现 取 反 ~ 操作 时 ， 是 通过 与 | 




















1(0xffffffff) 做 异 或 (xor ) 操作 完成 的 。 














从 上 面 可 以 看 到 , 通过 使 用 变量 句柄 表示 操作 数 栈 中 变量 的 值 , 可 以 从 源 代码 中 重 构 出 表达 
式 。 例 如 ， 指 令 iload_0， 其 含义 是 “将 局 部 变量 0 中 的 值 压 人 操作 数 栈 "， 会 生成 模拟 栈 中 的 
表达 式 v0。 在 示例 代码 中 ， 模 拟 需 逐步 形成 了 越 来 越 复杂 的 表达 式 ， 当 需要 将 其 从 栈 中 弹出 并 
返回 时 ， 该 表达 式 就 可 用 于 生成 最 终 的 代码 。 

下 面 的 代码 就 是 Bc2HIR 的 输出 ， 即 HIR : 

params: v1 v2 v3 


block0: [first] [id=0] 
10 @9:49 (132) return {or {and v1 v2} {and {xor v1 -1} v3}} 











在 JRockit 4 IR 中 ,每 条 语句 前 的 注解 8 表示 了 从 源 代码 到 汇编 语言 的 映射 。 

@ 后 面 的 第 一 个 数字 表示 表达 式 在 字 节 码 中 的 偏 移 位 置 ， 其 后 的 数字 是 对 应 源 代 

> 码 的 行 号 。JRockit 中 就 是 使 用 这 种 复杂 的 元 信息 结构 将 本 地 指令 映射 到 Java 源 
代码 的 。 





局 部 变量 的 索引 位 置 是 由 JRockit 分 配 的， 在 字 节 码 中 各 不 相同 ， 从 而 与 其 他 变量 相 区 别 。 
需要 注意 的 是 , 字 节 码 操作 可 能 以 其 他 操作 作为 操作 数 ,形成 了 艇 套 的 表达 式 ， 作 为 将 字 节 码 操 
作 数 栈 的 内 容 转换 为 表达 式 的 过 程 中 所 产生 的 副产品 ,这 实际 上 是 很 有 用 的 。 通 过 这 种 方式 , 我 
们 得 到 的 是 HIR， 而 不 是 由 典型 的 、 扁 平 化 的 、 使 用 临时 变量 赋值 的 代码 ， 而 在 这 些 代 码 中 ， 操 
作 指 令 的 操作 数 中 可 能 并 不 包含 其 他 操作 。 相 比 于 其 他 格式 ，HIR 更 适合 做 某 些 优 化 , 例如 检查 
同一 子 表达 式 〈 其 表示 形式 是 一 棵 子 树 ) 是 否 出 现 了 多 次 ， 如果 是 的 话 ， 可 以 将 子 表 达 式 合成 一 
个 临时 变量 以 避免 重复 计算 。 

但 在 模拟 操作 数 栈 的 变化 以 构造 HIR 的 过 程 中 还 会 遇 到 一 些 其 他 问题 ， 产 生 这 些 问题 的 根 
本 原因 在 于 编译 时 只 能 知道 栈 中 的 表达 式 是 什么 ， 而 无 法 计算 出 其 确切 的 值 。 在 某 些 场景 下 , k 
中 对 内 存 的 使 用 就 可 能 会 由 于 上 述 的 不 确定 性 而 产生 问题 ， 例 如 假设 编译 源 代码 result = x ? 
a: b 后 得 到 的 字 节 码 如 下 : 


/* bytecode for: "return x ? a: b" */ 
static int test(boolean x, int a, int b); 
































































































































JIT 编译 器 首先 处 理 了 及， 查找 代码 中 是 否 存在 跳 转 ， 确 定 基本 块 ， 生 成 控制 流 图 ,并 使 用 代码 E 
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0: iload 0 //push x 

1: ifeq 8 //if x == false then goto 8 
4: iload_1 //push a 

5: goto 9 

8: iload_2 //push b 

9: ireturn //return pop 


当 模 拟 需 执行 到 ireturn 指令 时 ， 从 栈 中 弹出 的 值 可 能 是 a ( 局 部 变量 1 ) 或 者 b ( 局 部 变 
量 2 )。 由 于 无 法 使 用 一 个 变量 来 表示 “a 或 者 bP”， 所 以 就 需要 在 偏 移 位 置 4 和 8 人 处 ,将 要 返回 
的 值 压 入 到 栈 中 ， 并 通过 跳 转 指令 的 配合 完成 对 弹出 的 返回 值 的 控制 。 

BC2HIR 模块 将 字 节 码 转换 为 控制 流 图 ， 其 中 的 表达 式 计 算 起 来 并 不 复杂 。 但 是 这 个 过 程 中 
可 能 会 包含 其 他 一 些 比较 少见 的 、 超 出 了 本 书 讨论 范围 的 内 容 , 其 中 的 大 部 分 实例 都 与 字 节 码 结 
构 缺 失 和 操作 数 栈 相 关 。 另 一 个 例子 跟 monitorenter 指令 和 对 应 的 monitorexit 指令 相关 ， 
这 部 分 内 容 将 在 第 4 章 详细 阐述 。 

e 中 级 中 间 表 示 (MIR) 

MIR， 即 中 级 中 间 表 示 (middle-level intermediate representation )， 介 于 HIR 和 LIR (低级 中 
间 表 示 ) 之 间 的 过 渡 形 式 。 大 部 分 代码 优化 工作 都 是 在 MIR 这 个 阶段 完成 的 ， 原 因 在 于 大 部 分 
优化 工作 都 适用 于 三 地 址 代码 (three address code )， 确 切 地 说 是 只 包含 了 原子 操作 的 具体 指令 。 
从 HIR 转换 到 MIR 的 过 程 其 实 只 需 对 表达 式 树 执 行 中 序 遍历 并 创建 临时 变量 即 可 。 由 于 表达 式 
树 不 涉及 硬件 ， 可 以 对 代码 做 很 多 优化 ， 使 代码 变 得 更 简练 些 。 

如 果 将 表达 式 树 拉平 的 话 , 那么 对 于 JIT 编译 器 来 说 , md5_F 函数 应 该 类 似 于 下 面 的 示例 代 
码 。 注 意 ， 已 经 不 存在 伦 套 操作 了 ， 操 作 结 果 都 会 被 写 人 到 临时 变量 中 ， 供 后 续 操 作 使 用 。 


params: v1 v2 v3 
block0: [first] [id=0] 











































































































2 @2:49* (i32) and v1 v2 -> v4 
5 @5:49* (i32) xor v1 -1 -> v5 
7 @7:49* (i32) and v5 v3 -> v5 
8 @8:49* (i32) or v4 v5 -> v4 
10 @9:49* (i32) return v4 


对 于 来 自 优 化 器 的 代码 生成 请 求 ， 大 部 分 代码 优化 工作 都 会 在 MIR 阶段 完成 。 这 部 分 内 容 
将 在 后 文中 详细 讨论 。 

o 低级 中 间 表 示 (LIR) 

经 过 MIR 阶段 的 处 理 后 ， 就 需要 将 代码 转换 为 平台 相关 的 本 地 代码 ， 依 赖 于 不 同 的 硬件 架 
构 ， 和 后 成 不 同 的 LIR (lowerlevelIR， 低 级 中 间 表 示 )。 

由 于 大 部 分 有 下 ockit 都 运行 在 x86 平 台 上 ， 所 以 下 面 以 x86 平台 为 例 说 明 LIR。 早 在 20 世纪 
80 年 代 初 期 ，x86 平台 就 已 经 出 现 ， 那 时 候 使 用 的 是 CISC 格式 的 指令 ， 而 上 一 节 中 介绍 的 MIR 
使 用 的 指令 类 似 于 RISC 的 格式 ， 两 者 不 甚 匹配 。 例 如 , 在 x86 平 台 上 ，ang 操作 的 第 一 个 源 地 址 
与 目标 地 址 必须 相同 , 这 也 是 在 转换 为 更 适合 x86 平 台 模 型 的 代码 时 要 引 和 一些 临时 变量 的 原因 。 

如 果 目 标 平台 是 SPARC, 转换 工作 就 会 少 很 多 , 因为 SPARC 平台 的 本 地 代码 格式 与 JRockit 
IR 类 似 。 
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下 面 的 代码 是 函数 md5_F 在 32 位 x86 平 台 的 LIR: 


params: v1 v2 v3 
block0: [first] [id=0] 


2 @2:49* (i32) x86_and v2 v1 -> v2 
11 @2:49 (i32) x86_mov v2 -> v4 

5 @5:49* (i32) x86_xor v1 -1 -> v1 
12 @5:49 (i32) x86_mov v1 -> v5 

7 @7:49* (i32) %*86_and v5 v3 -> v5 
8 @8:49* (i32) x86_or v4 v5 -> v4 
14 @9:49 (i32) x86_mov v4 -> eax 
13 @9:49* (i32) x*86_ret eax 


从 上 面 的 代码 可 以 看 出 , 为 了 正确 表达 代码 的 语义 ,这 一 步 中 , 在 原先 的 代码 中 插入 了 一 些 
平台 无 关 的 mov 指令 。 注 意 ，and，xor 和 or 操作 ， 这 些 操作 的 第 一 个 操作 数 与 目标 结果 的 位 
置 相 同 , 这 是 x86 平台 本 身 要 求 的 。 另 外 值得 注意 的 是 , 在 这 里 以 硬 编 码 方式 指定 了 对 寄存 器 的 
使 用 。 按 照 Rockit 调 用 规范 的 要 求 ， 待 返回 的 整数 结果 要 放 到 寄存 器 eax 中 ， 所 以 ， 寄 存 器 分 
配器 就 直接 以 硬 编码 的 方式 指明 eax 作为 存储 返回 值 的 寄存 器 。 

o 寄存 器 分 配 

生成 的 中 间 代 码 可 能 需要 使 用 多 个 虚拟 寄存 器 ( 变量 ), 但 现实 中 ， 寄 存 器 的 数量 有 限 ， 可 
能 会 不 够 用 。 因 此 ， 在 生成 本 地 代码 时 ，JIT 编译 絮 需要 规划 寄存 器 分 配 (register allocation ), 
才能 将 虚拟 寄存 器 映射 到 真实 的 寄存 器 。 例 如 在 程序 运行 中 的 某 个 时 间 点 上 ,如 果 用 到 的 变量 数 
比 可 用 的 物理 寄存 器 多 ， 则 需要 使 用 栈 帧 作为 临时 存储 。 这 种 方式 称 为 溢出 〈spilling )， 其 具体 
实现 是 插入 移动 指令 将 数据 存储 到 主 存 中 , 使 用 的 时 候 再 从 主 存 中 取出 。 涪 出 方式 本 身 会 产生 性 
能 损耗 ， 因 此 如 何 使 用 溢出 对 生成 的 代码 的 执行 效率 影响 很 大 。 

如 果 寄 存 器 分 配 过 程 实现 得 比较 粗糙 ， 则 可 以 很 快 完成 ， 例 如 在 JIT 编译 的 第 一 个 阶段 , 但 
如 果 想 要 实现 得 好 一 些 , 就 需要 经 过 大 量 的 计算 和 规划 才 行 , 尤其 是 在 需要 同时 使 用 多 个 变量 的 
场景 下 。 不 过 ,在 示例 代码 中 ,由 于 只 用 到 了 较 少 的 变量 ， 做 优化 时 不 需要 花 太 多 力气 ， 只 需要 
合并 或 剔除 几 个 mov 指令 即 可 。 

示例 函数 ma5_F 中 并 没有 使 用 溢出 技术 ， 因 为 x86 平 台 有 7 个 寄存 需 可 用 (在 64 位 平台 上 
有 15 个 寄存 器 )， 而 这 里 只 用 到 了 3 个 : 


params: ecx eax edx 
block0: [first] [id=0] 





































































































2 @2:49* (i32) x86_and eax ecx -> eax 
5 @5:49* (i32) x86_xor ecx -1 -> ecx 
7 @7:49* (i32) x86_and ecx edx -> ecx 
8 @8:49* (i32) x86_or eax ecx -> eax 
13 @9:49* (void) x86_ret eax 





上 面 代码 中 的 每 一 个 指令 都 与 具有 相同 功能 的 本 地 平台 指令 相对 应 , 也 就 是 最 终 要 生成 的 本 
地 代码 。 

下 面 借助 一 个 稍微 复杂 一 点 的 示例 来 深入 了 解 溢出 技术 。 在 Spill 类 的 main 方法 中 会 同 
时 用 到 8 个 变量 ， 计 算 乘 积 : 
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public class Spill { 
static int aField, bField, cField, dField; 
static int eField, fField, gField, hField; 
static int answer; 
public static void main(String args[]) { 
int a = aField; 
int b = bField; 
int c = cField; 
int d = dField; 
int e = eField; 
int f = fField; 
int g = gField; 
int h = hField; 
answer = a*b*c*d*e*f*g*h; 
} 
} 
本 例 使 用 32 位 x86 作为 实验 平台 ， 是 因为 32 位 x86 平 台 只 有 7 个 寄存 器 可 用 ， 而 需要 用 到 





的 变量 有 8 个, 因此 会 将 其 


理 的 LIR。 


E 





中 一 个 中 间 值 存储 到 栈 上 。 下 面 的 代码 片 


使 用 汇编 或 LIR 指令 从 内 存 中 取 值 时 ， 


以 此 表示 读 取 该 指针 所 指 的 内 存 位 置 上 的 值 。 例 如 ， 
表示 要 读 取 从 栈 指针 起 偏 移 8 字 节 


block0: [fir 


68 
69 
70 
43 
44 
67 
45 
46 
47 
48 
49 
50 
26 
28 
30 
32 
34 
36 
38 
65 
71 
72 
73 
66 


@0:7* 
@4:8* 
@4:8 
@8:9* 
@12:10* 
@17:11* 
@22:12* 
@27:13* 
@32:14* 
@39:16 
@41:16 
@44:16 
@47:16 
@50:16 
@53:16 
@56:16 
@57:16* 
@60:18* 
@60:18 
@60:18 
@60:18 


st] [id= 


(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(i32) 
(void) 


0] 
x86_push 
x86_push 
x86_sub 
x86_mov 
x86_mov 
x86_mov 
x86_mov 
x86_mov 
x86_mov 
x86_mov 
x86_mov 
x86_mov 
x86_imul 
x86_imul 
x86_imul 
x86_imul 
x86_imul 
x86_imul 
x86_imul 
x86_mov 
x86_add 
x86_pop 
x86_pop 
x86_ret 


役 显示 了 经 过 寄存 器 分 再 











通常 都 是 使 用 方 括号 将 指针 括 起 来 ， 


在 x86 平 台 上 ， 
节 的 位 置 的 值 。 
ebx //store callee save reg 
ebp //store callee save reg 


esp 4 -> esp //alloc stack for 1 spill 


[Ox£56bd7£8] -> 
[Ox£56bd7fc] -> 


edx -> [esp+0x0] 


[Ox£56bd800] -> 
[Ox£56bd804] -> 
[Ox£56bd808] -> 
[Ox£56bd80c] -> 
[Ox£56bd810] -> 
[Ox£56bd814] -> 


esi 
edx 


edi 
ecx 
edx 
eax 
ebx 
ebp 


//*aField->esi 
//*bField->edx 


(a) 
(b) 


//spill b to stack 


//*cField->edi 
//*aField->ecx 
//*eField->edx 
//*£Field->eax 
//*gField->ebx 
//*hField->ebp 


esi [esp+0x0] -> esi //a *= b 


esi edi -> esi 
esi ecx -> esi 
esi edx -> esi 
esi eax -> esi 
esi ebx -> esi 
esi ebp -> esi 


esi -> [0xf56bd818] 


esp, 4 -> esp 


//a *= C 
//a *= a4 
//a *= e 
//a *= f 
//a *=g 
//a *=h 


//*answer =a 


(c) 
(d) 
(e) 
(£) 
(g) 
(h) 


//free stack slot 


-> ebp //restore used callee save 
-> ebx //restore used callee save 
//return 


[esp + 8] 


0 处 
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从 上 面 的 代码 中 可 以 看 到 ， 寄 存 器 分 配器 将 方法 的 开头 和 结尾 处 添加 了 对 栈 操 作 的 相关 代 
B, 这 是 因为 在 临时 存储 中 间 结 果 时 需要 知道 栈 的 位 置 , 而 且 为 了 存储 结果 并 返回 还 需要 两 个 由 
被 调用 者 保存 (callee-save ) 的 寄存 器 。 由 被 调用 者 保存 的 寄存 器 是 指 寄 存 器 的 值 由 被 调用 者 负 
责 维 护 。 如 果 方 法 在 执行 过 程 中 需要 覆盖 由 被 调用 者 保存 的 寄存 器 中 的 值 , 就 必须 将 寄存 器 中 的 
值 临时 存储 到 栈 帧 中 ， 并 在 方法 返回 之 前 恢复 寄存 器 中 的 值 。 按 照 x86 平 台 上 JRockit 的 调用 约 
xe, Java 中 使 用 的 由 被 调用 者 保存 的 寄存 器 是 ebp 和 sbx。 一 般 情况 下 ， 任 何 调用 约定 都 会 包 
含 一 些 由 被 调用 者 保存 的 寡 存 器 , 因为 每 个 寄存 器 的 值 在 使 用 过 之 后 都 有 可 能 会 被 销毁 ,从 而 导 
致使 用 更 多 的 溢出 代码 来 存储 数据 ， 进 而 影响 程序 的 执行 效率 。 

o 生成 本 地 代码 

经 过 寄存 器 分 配 后 ,IR 中 的 每 个 操作 就 都 可 以 与 x86 平 台 上 机 器 语言 的 某 个 本 地 操作 一 一 对 
应 上 了 。 现 在 ,JIT 编译 器 的 工作 就 只 剩 下 在 LIR 中 插入 一 些 mov 指令 来 分 配 参 数 ( 在 示例 代码 
中 ， 程 序 会 将 传人 参数 的 值 按照 调用 约定 移动 到 预先 定义 好 的 位 置 ， 即 之 前 分 配 的 寄存 器 中 )。 
有 时 候 ， 尽 管 寄 存 器 分 配器 经 过 计算 认为 可 以 直接 将 第 一 个 参数 存 和 到 ecx 中 ,但 编译 器 并 不 
理会 这 些 ， 仍 会 按照 调用 约定 工作 ， 将 第 一 个 参数 存 人 到 eax 中 ， 此 时 需要 额外 的 mov 指令 。 
在 示例 代码 中 ， 按 照 JRockit 调用 约定 ， 参 数 x、y 和 z 分 别 被 存储 到 eax, edax 和 esi 中 。 


| 在 x86 平 人 台 上 , 从 JRockit 中转 储 出 的 汇编 代码 使 用 的 是 Intel 风格 的 语法 , 将 | 


































































































第 一 个 操作 数 作为 目的 操作 数 ， 例 如 and ebx eax 的 意思 是 ebx = ebx & eax。 





下 面 的 代码 展示 了 存储 于 代码 缓冲 区 中 的 最 终 的 本 地 代码 : 


[method is md5_F(III)I [02DB2FFO - 02DB3002]] 


02DB2FF0: mov ecx, eax 
O2DB2FF2: mov eax, edx 
O2DB2FF4: and eax, ecx 
O2DB2FF6: xor ecx, 0xffffffff 
O2DB2FF9: and ecx,esi 
O2DB2FFC: or eax, ecx 
O2DB2FFF: ret 
2. 代码 优化 





相 比 于 普通 的 JIT 编译 ,优化 热 方法 并 重新 生成 代码 在 执行 时 略 有 不 同 。 其 实 ， 优 化 编译 器 
作用 于 代码 流水 线 的 整个 过 程 ， 围 绕 着 代码 生成 ， 在 各 个 阶段 中 插入 相应 的 优化 模块 ， 见 下 网 。 


Psa | [高级 中 间 表 示 到 TOTEE] m 7 

中 间 表 示 中 级 中 间 表 示 低级 中 间 表 示 ee 
优化 高 级 优化 中 级 基于 图 融合 的 

中 间 表 示 中 间 表示 寄存 器 分 配 


o 概述 
不 同 的 优化 方法 适用 于 不 同 层级 的 IR, HU, SF HIR， 常 用 的 优化 方法 有 全 局 数值 编号 




























































优化 低级 
中 间 表 示 
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(global value numbering )， 使 用 一 棵 子 树 替换 某 个 表达 式 的 两 棵 相同 子 树 ， 以 及 临时 变量 赋值 
(temporary variable assignment ) 等 。 

在 MIR 中 常用 的 一 种 优化 是 转换 为 SSA 形式 (single static assignment form, 静态 单 赋值 形式 )， 
即 确保 任意 变量 只 有 一 种 定义 。 SSA 转换 几乎 已 成 为 现代 商用 编译 器 的 必 备 优化 手段 之 一 , 因为 在 
其 基础 上 可 以 有 效 地 实现 多 种 代码 优化 技术 ， 而 且 优 化 效果 也 比 未 使 用 SSA 转换 的 代码 更 好 。 





































































































if (x > 0) if (x,> 0} 
result = 1 result =O result, = 1] | result, =0 
return result result, = Ò (result, result, ) 
return result, 





























上 面 的 流 图 展示 了 SSA 转换 前 后 的 区 别 。 程 序 返 回 的 变量 result 的 值 依赖 于 变量 x 的 值 
和 分 支 目 的 , 可 能 是 0 或 者 1。 由 于 SSA 形式 要 求 每 个 变量 只 能 有 一 种 赋值 , 变量 result 被 表 
示 为 3 个 不 同 的 变量 。 可 以 看 到 ， 在 return 语句 中 ， 变 量 result 可 以 是 resul, 或 resul,， 
为 了 表示 出 或 的 意思 , 特意 使 用 了 一 个 连接 符 (join operator ) @ ( 这 是 个 希腊 字母 , 读音 为 phi )。 
但 实际 上 ,目前 的 硬件 平台 都 不 支持 这 样 的 操作 ， 所以, 最 终生 成 本 地 代码 之 前 还 需要 转换 回 普 
通 的 形式 。 这 种 反 向 转换 一 般 是 使 用 提前 赋值 来 蔡 换 连接 符 ， 连接 ( join ) 操作 的 每 个 来 源 都 
会 产生 一 条 流 路 径 。 

很 多 经 典 的 代码 优化 方法 , P SITS (constant propagation ) 和 复制 传播 ( copy propagation ), 
应 用 于 经 过 SSA 转换 的 代码 时 都 能 运行 得 更 有 效率 ， 很 大 程度 上 是 因为 经 过 处 理 后 ， 变 量 的 定 
义 都 不 再 有 任何 歧义 。 有 关 SSA 的 内 容 超出 了 本 书 的 范围 ， 而 且 已 经 有 很 多 文献 做 了 介绍 ， 这 
里 不 再 赣 述 。 

LIR 是 平台 相关 的 ， 且 没有 经 过 寄存 器 分 配 这 个 过 程 ， 所 以 可 以 在 这 里 做 一 些 指令 转换 ,使 
生成 的 本 地 操作 序列 更 有 效率 。 例 如 ,在 x86 平台 上 ， 为 了 加 快 复制 数组 的 速度 ， 可 以 用 Intel 
特有 的 SSE4 指令 替换 普通 的 循环 复制 操作 。 




































































在 生成 优化 代码 时 ,如 何 分 配 寄存 器 非常 重要 。 编 译 器 教材 上 都 将 寄存 器 分 
配 问 题 作 为 图 的 着 色 问 题 处 理 , 这 是 因为 同时 用 到 的 两 个 变量 不 能 共享 同一 个 寄 
存 器 ,从 这 点 上 讲 , 与 着 色 问 题 相同 。 同时 使 用 的 多 个 交 量 可 以 用 图 中 相连 接 的 
节点 来 表示 ， 这 样 ， 寄 存 器 分 配 问题 就 可 以 被 抽象 为 “如 何 为 图 中 的 节点 着 色 ， 
QS 才能 使 相连 节点 有 不 同 的 颜色 "。 这 里 可 用 闫 色 的 数量 等 于 指定 平台 上 可 用 寄存 
器 的 数量 。 不 过 ， 遗 憾 的 是 ， 从 计算 复杂 性 上 讲 ， 着 色 问 题 是 NP-hard 的 ,也 
就 是 说 现在 还 没有 一 个 高 效 的 算法 ( 指 可 以 在 多 项 式 时 间 内 完成 计算 ) 能 解决 这 
个 问题 。 但 是 ,着色 问题 可 以 在 线性 对 数 时 间 内 给 出 近似 解 ， 因 此 大 多 数 编译 器 
都 使 用 着 色 算 法 的 某 个 变种 来 处 理 寄 存 器 分 配 问 题 。 
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JRockit 优化 编译 右 中 的 高 级 寄存 器 分 配器 基于 图 融合 (graph fusion) 技术 ,该 技术 作用 于 
IR， 是 对 标准 的 图 着 色 近 似 算法 的 扩展 。 图 融合 技术 的 一 大 特点 的 是 ， 会 提前 处 理 流 图 中 的 边 ， 
这 样 可 以 产生 更 少 的 浇 出 代码 。 因 此 ， 如 果 能 在 处 理 之 前 找 出 代码 的 热点 区 域 , 生成 的 代码 在 运 
行 时 就 能 更 加 高 效 。 这 种 方法 的 代价 是 ,在 融合 代码 时 ,为 了 生成 完整 的 方法 , 需要 插入 一 些 洗 
牌 代码 ( shuffle code )， 洗 牌 代 码 包 含 了 一 系列 移动 指令 ， 用 于 将 一 个 寄存 器 中 的 内 容 复制 到 另 
一 个 寄存 器 。 

最 后 ， 优 化 编译 器 可 以 对 生成 的 本 地 代码 执行 各 种 完 孔 优化 ( peephole optimization )， 将 生 
成 代码 中 的 部 分 指令 替换 为 更 高 效 的 本 地 指令 ， 然 后 再 提交 给 JRockit 供 其 调用 。 


























一 般 来 说 , 清空 寄存 器 是 通过 其 对 自身 做 异 或 操作 完成 的 。 相 比 于 执行 指令 
mov eax, 0，, 与 自身 做 异 或 操作 的 执行 效率 更 高 一 些 。 这 就 是 宽 孔 优化 的 一 种 ， 
作用 于 确切 的 菜 条 指令 。 再 举 一 个 例子 , Ex86F GL, WREMUHLELAR 
以 2 的 n 次 方 ， 后 跟 与 菜 数 相 加 的 add 指令 ， 那 么 就 可 以 使 用 lea 指令 作为 代 
替 直 接 完成 。 


o 优化 器 工作 原理 

本 书 的 主旨 是 介绍 JRcokit 代码 流水 线 相关 的 算法 和 优化 策略 ， 在 这 一 节 ， 先 简单 谈 谈 JVM 
如 何 利 用 运行 时 提供 的 反馈 信息 来 优化 代码 。 

一 般 情况 下 , 相 比 于 那些 对 执行 速度 没什么 要 求 的 JIT 编译 来 说 , JRockit 对 一 个 方法 执行 优 
化 编译 需要 花费 10 到 100 倍 的 时 间 ， 因 此 ， 只 优化 那些 热 方法 就 显得 很 必要 了 。 

简单 来 说 ， 插 入 到 代码 流水 线 各 个 阶段 的 优化 模块 是 以 下 面 的 方式 工作 的 。 

aa 会 弃 方法 调用 ， 以 内 联 的 方式 将 控制 流 展开 

(2) 对 内 联 后 生成 的 大 块 代码 做 各 种 优化 ， 使 其 精简 

} while ("有 足够 的 时 间 "” && "有 足够 的 精力 ( 即 需要 优化 的 代码 的 数量 不 会 增长 得 太 快 ) ) ; 

Java 是 面向 对 象 的 语言 ， 会 用 到 很 多 getter, setter 和 其 他 细碎 的 方法 调用 ， 而 编译 器 
在 开始 优化 的 时 候 却 不 得 不 假设 这 些 方法 是 很 复杂 的 ， 因 为 它 不 知道 这 些 方法 实际 上 是 干什么 
的 , 由 此 产生 诸多 不 必要 的 麻烦 。 所 以 , 为 了 简单 起 见 , 小 方法 通常 会 被 内 联 。 相 对 来 说 , JRockit 
比较 激进 , 会 根据 运行 时 采集 到 的 信息 ,按照 适当 的 优先 级 , 尽 可 能 地 将 热点 执行 路 径 中 所 有 调 
用 做 内 联 处 理 。 

对 于 静态 编译 环境 来 说 ， 过 于 激进 的 内 联 往往 适得其反 ,生成 的 方法 过 大 的 话 ， 会 增加 指令 
缓冲 区 的 负担 ， 降 低 执 行 效 率 ; 而 在 动态 运行 时 环境 中 ,可 以 对 运行 时 数据 采样 ， 从 而 更 准确 地 
判断 出 应 该 对 哪些 方法 做 内 联 处 理 。 

经 过 内 联 这 一 步 之 后 ,包含 了 内 联 代码 的 方法 通常 会 变 得 很 大 ， 这 时 JIT 优化 编译 器 会 使 用 
各 种 优化 方法 来 精简 代码 ， 例 如 ， 常 量 折 又 (fold constant )， 基 于 逃逸 分 析 剔 除 某 些 表达 式 ， 吻 
除 永 远 不 会 执行 的 死 代码 (dead code ) 等 。 此 外 ， 在 特定 条 件 下 ， 对 统一 内 存 区 域 的 重复 存 取 也 
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经 过 上 述 重重 优化 后 的 代码 ， 往 往 会 比 内 联 之 前 的 原始 代码 更 小 ， 这 就 是 优化 编译 的 威力 。 
事实 上 ， 即 使 要 处 理 的 代码 量 很 少 , 优化 编译 系统 仍然 需要 做 很 多 优化 工作 。 以 下 面 的 代码 

















为 例 ， 类 circle 可 以 根据 半径 计算 出 面积 。 
public class Circle { 
private double radius; 


public Circle(int radius) { 
this.radius = radius; 


} 


public double getArea() { 
return 3.1415 * radius * radius; 


} 


public static double getAreaFromRadius(int radius) { 
Circle c = new Circle(radius) ; 
return c.getArea(); 


} 


static int areas[] = new int[0x10000]; 

static int radii[] = new int[0x10000]; 

static java.util.Random r = new java.util.Random(); 
static int MAX_ITERATIONS = 1000; 


public static void gen() { 
for (int i = 0; i < areas.length; i++) { 





areas[i] = (int)getAreaFromRadius(radii[i]); 
} 
} 
public static void main(String args[]) { 
for (int i = 0; i < radii.length; i++) { 
radii[i] = r.nextInt(); 


} 
for (int i = 0; i < MAX_ITERATIONS; i++) { 
gen(); // 训 免 使 用 栈 上 替换 


} 


运行 上 面 的 程序 , 并 附加 命令 行 参 数 -Xverbose:opt,gc 以 便 JRockit 打印 出 垃圾 回收 和 代 


码 优 化 信息 ， 如 下 所 示 。 


hastur:material marcus$ java -Xverbose:opt,gc Circle 

[INFO ][memory ] [YC#1] 0.584-0.587: YC 33280KB->8962KB (65536KB), 
0.003 s, sum of pauses 2.546 ms, longest pause 2.546 ms 

[INFO ] [memory ] [YC#2] 0.665-0.666: YC 33536KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.533 ms, longest pause 0.533 ms 

[INFO ] [memory ] [YC#3] 0.743-0.743: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.462 ms, longest pause 0.462 ms 
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[INFO ] [memory ] [YC#4] 0.821-0.821: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.462 ms, longest pause 0.462 ms 

[INFO ] [memory ] [YC#5] 0.898-0.899: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.463 ms, longest pause 0.463 ms 

[INFO ] [memory ] [YC#6] 0.975-0.976: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.448 ms, longest pause 0.448 ms 

[INFO ][memory ] [YC#7] 1.055-1.055: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.461 ms, longest pause 0.461 ms 

[INFO ][memory ] [YC#8] 1.132-1.133: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.448 ms, longest pause 0.448 ms 

[INFO ][memory ] [YC#9] 1.210-1.210: YC 33600KB->9026KB (65536KB), 
0.001 s, sum of pauses 0.480 ms, longest pause 0.480 ms 





[INFO ] [opt ][00020] #1 (Opt) 
jrockit/vm/Allocator.allocObjectOrArray (IIIZ)Ljava/lang/Object; 
[INFO ] [opt ] [00020] #1 1.575-1.581 0x9e04c000-0x9e04c1lad 5 


.72 ms 192KB 49274 bc/s (5.72 ms 49274 bc/s) 
[INFO ] [memory ] [YC#10] 1.607-1.608: YC 33600KB->9090KB 
(65536KB), 0.001 s, sum of pauses 0.650 ms, longest pause 0.650 ms 
[INFO ][memory ] [YC#11] 1.671-1.672: YC 33664KB->9090KB (65536KB), 
0.001 s, sum of pauses 0.453 ms, longest pause 0.453 ms. 


[INFO ] [opt ] [00020] #2 (Opt) 
jrockit/vm/Allocator.allocObject (I) Ljava/lang/Object; 
[INFO ] [opt ] [00020] #2 1.685-1.689 0x9e04c1c0-0x9e04c30d 3 


-88 ms 192KB 83078 bc/s (9.60 ms 62923 bc/s) 
[INFO ][memory ] [YC#12] 1.733-1.734: YC 33664KB->9090KB 
(65536KB), 0.001 s, sum of pauses 0.459 ms, longest pause 0.459 ms. 


[INFO ] [opt ][00020] #3 (Opt) Circle.gen()V 
[INFO ] [opt ] [00020] #3 1.741-1.743 0x9e04c320-0x9e04c3£f2 2 
-43 ms 128KB 44937 bc/s (12.02 ms 59295 bc/s) 
[INFO ] [opt ] [00020] #4 (Opt) Circle.main([Ljava/lang/String;)V 


[INFO ] [opt ][00020] #4 1.818-1.829 0x9e04c400-0x9e04c7af 11 
.04 ms 384KB 27364 bc/s (23.06 ms 44013 bc/s) 
hastur:material marcus$ 


打印 这 些 内 容 ， 然 后 程序 就 结束 运行 了 。 

本 章 的 末尾 会 详细 介绍 代码 生成 器 打印 的 各 种 日 志 ， 第 3 章 会 介绍 内 存 管理 器 打印 的 相关 
日 志 。 

在 这 里 ， 除 了 优化 编译 器 对 4 个 热 方法 〈 其 中 两 个 是 JRockit 的 内 部 方法 ) 做 了 优化 编译 之 
外 ,更 需要 注意 的 是 , 在 优化 编译 完成 之 后 ,垃圾 回收 也 不 再 执行 了 。 这 是 因为 ， sees 
分 析 后 ， 优 化 编译 器 发 现 getAreaFromRadius 方法 创建 的 Circle 对 和 象 只 是 用 来 计算 面积 自 
只 存活 于 该 方法 内 ， 尤 其 pes c.getArea 内 联 进来 之 后 ， 这 一 点 更 加 明显 。 nie 
Circle 对 象 中 只 包含 一 个 double 类 型 的 成 员 变 量 *adqius ， 在 明确 了 该 对 象 的 存活 范围 后 ， 
就 可 以 使 用 double 2 量 来 表示 该 对 象 了 。 在 剔除 了 用 于 创建 对 象 的 内 存 分 配 操作 后 , 也 
就 不 会 再 有 垃圾 回收 的 操作 了 。 

当然 , 这 只 是 个 小 实验 ,其 中 所 表达 的 避免 重复 创建 Circle 对 象 的 意思 也 很 容易 理解 。 不 
过 ， 如 果 能 够 合理 实现 优化 算法 的 话 ， 它 对 于 大 型 面向 对 象 应 用 程序 也 是 适用 的 。 
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其 实 ,在 检测 程序 的 某 些 运行 模式 方面 , 运行 时 确实 比 人 工 更 可 靠 ， 总 能 够 
发 现 人 工 难以 发 现 的 优化 点 。 除 此 之 外 , 优化 编译 器 为 应 用 各 种 优化 方法 设 定 的 
假设 条 件 也 很 少 失效 。 从 这 些 方面 讲 ， 自 适应 运行 时 确实 是 威力 惊人 。 





未 经 优化 的 Java 代码 执行 效率 较 差 ,javac 需要 在 将 源 代码 编译 为 字 节 码 时 做 一 些 基 本 优化 ， 
以 实现 相关 语言 特性 。 例 如 ， 使 用 + 操作 符 连接 字符 串 是 一 个 语法 糖 ， 编 译 器 需要 创建 
StringBuilder 对 象 ， 并 调用 其 append 方法 来 完成 字符 串 连 接 的 操作 。 类 似 这 种 将 语法 糖 转 
换 为 优化 程度 更 高 的 代码 的 操作 ， 对 于 优化 编译 器 来 说 不 算 什么 问题 。 例 如 ， 由 于 
StringBuilder 的 实现 是 已 知 的 ， 所 以 我 们 可 以 告知 编译 器 其 方法 是 没有 任何 副作用 的 ， 即 使 
编译 器 还 没有 生成 对 这 些 方法 的 调用 

类 似 的 操作 也 适用 于 装 箱 类 型 ( boxed type )。 在 字 节 码 层面 ， 装 箱 类 型 会 被 隐 式 地 转换 为 对 
Z (例如 java.lang.Integer 类 )。 应 用 一 些 传统 的 优化 方法 ， 例 如 逃逸 分 析 ， 可 以 将 操作 对 
象 转换 为 操作 原生 类 型 ， 这 样 就 可 以 吻 除 实现 装 箱 类 型 所 需 的 内 存 分 配 操 作 。 
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相 比 于 其 他 SVM, JRockit 的 设计 颇 为 不 同 ， 它 不 鼓励 过 多 地 使 用 命令 行 参数 ， 即 使 要 改变 
代码 生成 和 优化 策略 也 不 例外 。 本 节 的 内 容 以 介绍 说 明 为 主 , 读者 在 使 用 相关 命令 行 参数 时 应 小 
心 可 能 产生 的 副作用 。 
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本 节 的 内 容 主 要 适用 于 JRockit R28 及 其 后 的 版 本 。 如 果 读 者 使 用 的 是 早期 
的 版 本 ， 那 么 请 查询 相关 文档 以 确定 与 本 节 内 容 相对 应 的 部 分 。 注 意 ，R28 版 本 
的 部 分 功能 可 能 与 之 前 的 版 本 略 有 不 同 。 


命令 行 选项 与 指令 文件 

在 JRockit 中 ， 很 少 会 因 代码 生成 器 故障 而 导致 问题 、 应 用 程序 行为 异常 ， 或 是 花费 很 长 时 
间 去 优化 某 个 方法 , 这 是 因为 代码 生成 器 的 行为 是 可 控 的 , 读者 可 以 根据 具体 需求 而 修改 代码 生 
成 如 的 行为 。 当 然 ， 这 样 的 前 提 是 ， 读 者 清楚 地 知道 自己 在 做 什么 。 

1. 命令 行 参 数 

JRockit 支持 使 用 命令 行 选项 对 代码 生成 器 的 行为 做 粗 粒 度 的 控制 。 本 市 仅 对 其 中 一 部 分 标 
志 做 介绍 。 

o 打印 日 志 
选项 -xverbose:codegen( 或 者 -xverbose:opt ) 用 于 让 JRockit 在 每 次 执行 IT 编译 (或 
优化 ) 时 向 标准 错误 ( 即 stderr ) 打印 两 行 编译 相关 信息 。 
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以 常见 的 Helloworld 程序 为 例 ， 每 次 生成 代码 时 都 会 打印 两 行 日 志 ， 在 开始 和 结束 时 各 
一 行 。 


hastur:material marcus$ java -Xverbose:codegen HelloWorld 
[INFO ] [codegen] [00004] #1 (Normal) jrockit/vm/RNI.transitToJava(I)V 
[INFO ] [codegen] [00004] #1 0.027-0.027 0x9e5c0000-0x9e5c0023 0 
.14 ms (0.00 ms) 
[INFO ] [codegen] [00004] #2 (Normal) 
jrockit/vm/RNI.transitToJavaFromDbgEvent (I)V 
[INFO ] [codegen] [00004] #2 0.027-0.027 0x9e5c0040-0x9e5c0063 0 
-03 ms (0.00 ms) 
[INFO ] [codegen] [00004] #3 (Normal) jrockit/vm/RNI.debuggerEvent ()V 
[INFO ] [codegen] [00004] #3 0.027-0.027 0x9e5c0080-0x9e5c0131 0 
.40 ms 64KB 0 bc/s (0.40 ms 0 bc/s) 
[INFO ] [codegen] [00004] #4 (Normal) 
jrockit/vm/ExceptionHandler.enterExceptionHandler () 
Ljava/lang/Throwable; 
[INFO ] [codegen] [00004] #4 0.027-0.028 0x9e5c0140-0x9e5c01ff 0 
.34 ms 64KB 0 bc/s (0.74 ms 0 bc/s) 
[INFO ] [codegen] [00004] #5 (Normal) 
jrockit/vm/ExceptionHandler.gotoHandler()V 
[INFO ] [codegen] [00004] #5 0.028-0.028 0x9e5c0200-0x9e5c025c 0 
.02 ms (0.74 ms) 





[INFO ] [codegen] [00044] #1149 (Normal) java/lang/Shutdown.runHooks()V 
[INFO ] [codegen] [00044] #1149 0.347-0.348 0x9e3b4040-0x9e3b4106 0 
.26 ms 128KB 219584 bc/s (270.77 ms 215775 bc/s) 


hastur:material marcus$ 

这 两 行 日 志 中 的 第 一 行 包含 以 下 信息 。 

O Info 标签 和 日 志 模 块 标识 符 ( 代码 生成 吉 )。 

口 当前 生成 代码 所 使 用 的 线程 的 ID。 视 具体 的 系统 配置 ， 这 里 可 能 会 有 多 个 代码 生成 线程 

和 代码 优化 线程 。 

O 生成 的 代码 的 索引 值 。 第 一 个 生成 的 代码 的 索引 值 是 1。 值得 注意 的 是 , 在 整个 日 志 的 开 
始 部 分 ， 生 成 代码 只 使 用 了 一 个 线程 ， 因 此 代码 生成 日 志 中 开始 和 结束 日 志 的 顺序 还 是 
正常 的 ， 是 连续 的 ， 但 当 使 用 多 个 线程 来 处 理 代码 时 ， 就 有 可 能 会 出 现 开 始 和 结束 日 志 
交错 的 现象 。 

口 代码 生成 策略 。 代 码 生 成 策略 指明 了 该 方法 的 生成 方式 。 由 于 在 刚 开始 运行 程序 时 ， 还 
无 法 收集 到 足够 多 的 运行 时 反馈 信息 ， 所 以 在 生成 代码 的 时 候 ， 或 是 使 用 普通 生成 策略 ， 
或 是 粗略 地 生成 一 个 立 等 可 用 的 代码 。 这 种 快速 生成 代码 的 策略 ， 主 要 应 用 于 那些 对 运 
行 时 性 能 没什么 影响 的 方法 ,例如 像 静 态 初始 化 方法 这 种 只 会 运行 一 次 的 ， 对 于 这 类 方 
法 ， 花 费 大 力气 为 其 做 寄存 器 分 配 之 类 的 优化 是 毫 无 意义 的 。 

O 待 生成 的 方法 。 具 体内 容 包括 类 名 、 方 法 名 和 方法 描述 符 。 

日 志 的 第 二 行 包括 以 下 信息 。 
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口 Info 标签 和 日 志 模 块 标识 符 (代码 生成 器 )。 
O 当前 生成 代码 所 使 用 的 线程 的 ID. 
口 生成 的 代码 的 索引 值 。 
O 代码 生成 事件 的 开始 和 结束 时 间 。 该 事件 是 自 JVM 启动 之 后 的 时 间 偏 移 值 ， 单 位 是 秒 。 
口 地 址 范围 。 这 是 生成 的 本 地 代码 要 放置 的 内 存 空间 。 
O 代码 生成 上 时间。 根据 该 方法 生成 对 应 的 本 地 代码 所 花费 的 时 间 ( 这 里 指 的 是 从 字 节 码 开 
始 )， 单 位 是 毫秒 。 
O 生成 代码 所 消耗 的 线程 局 部 内 存 的 最 大 值 。 这 个 值 是 代码 生成 线程 为 编译 代码 所 分 配 的 
内 存 空间 的 最 大 值 。 
Ch 每 秒 处 理 的 字 节 码 数量 的 平均 值 。 这 个 值 是 编译 该 方法 时 每 秒 编译 的 字 节 码 数量 的 平均 
值 。 注 意 ，0 表示 无 穷 大 ， 这 是 因为 精度 不 足 。 
O 生成 代码 所 花费 的 总 时 间 。 这 部 分 内 容 包括 自 JVM 启动 后 ， 该 线程 在 代码 生成 上 所 花费 
的 总 时 间 (单位 是 毫秒 )， 以 及 每 秒 编译 的 字 节 码 数量 的 平均 值 。 

o 关闭 优化 

命令 行 选项 -XnoOpt 和 -Xx:DisableOptsAfter=<time> 用 于 关闭 优化 编译 器 的 所 有 优 
化 操作 ， 区 别 在 于 选项 -xx: DisableOptsAfter=<time> 可 以 指定 在 JVM 启动 多 少 秒 之 后 再 
禁用 优化 。 应 用 选项 -xnoopt 可 以 加 快 应 用 程序 的 编译 速度 ,但 运行 效率 会 降低 。 如 果 怀 疑 是 
于 JRockit 优化 编译 器 而 导致 某 个 问题 的 出 现 ， 或 者 优化 编译 的 时 间 很 长 ， 则 可 以 应 用 
-XnoOpt 选项 。 

© 设置 优化 线程 数 

改变 JVM 编译 代码 所 用 的 线程 数 在 某 种 程度 上 可 以 使 应 用 程序 运行 得 更 好 ， 但 实际 情况 与 
具体 的 机 器 配置 有 关 。 除 了 将 本 地 代码 放 人 到 代码 缓冲 区 和 类 载 和 的 某 些 步骤 之 外 , 代码 的 生成 
和 优化 是 可 以 并 行 的 。 应 用 命令 行 选 项 -xx:JITThreads=<n> 可 以 指定 JIT 编译 器 线程 的 数量 ， 
选项 -XXx:OptThreads=<n> 可 以 指定 优化 线程 的 数量 。 注 意 , 优化 操作 需要 大 量 的 内 存 和 CPU 
资源 ， 即 使 机 器 中 CPU 的 核 很 多 ， 也 不 要 将 优化 线程 设置 得 过 多 。 

2. 指令 文件 

要 想 细 粒 度 地 控制 TRockit 的 代码 生成 ， 可 以 使 用 指令 文件 ( directive file )。 在 指令 文件 中 ， 
可 以 使 用 通配符 来 表示 多 个 目标 方法 ,并 指明 代码 生成 器 的 具体 行为 。 事 实 上 ,可 以 指定 的 行为 
非常 多 ， 本 节 重 在 介绍 指令 文件 的 相关 概念 ， 因 此 不 会 详 述 所 有 的 行为 。 


























































































































































































































警告 : JRockit 并 未 对 指令 文件 提供 完整 支持 ， 也 没有 发 布 过 正式 的 说 明文 

档 ， 将 来 也 有 可 能 会 修改 其 内 容 。Oracle 也 不 会 提供 使 用 指令 文件 控制 JRockit 
配置 的 功能 。 

命令 行 参数 -XX:OptFile=<filename> 用 于 指定 要 使 用 的 指令 文件 , 此 外 , 也 可 以 在 JVM 

运行 过 程 中 ,使 用 IRCMD 或 JRockit JavaAPI 来 添加 或 移 除 指令 文件 (关于 IRCMD 和 JRockit 
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Java API 的 内 容 会 在 本 书 的 后 续 章 节 中 介绍 )。 不 过 ， 要 想 使 用 指令 文件 ， 还 需要 应 用 命令 行 参 
数 -XX:+UnlockDiagnosticVMOptions。JVM 诊断 选项 在 将 来 的 JVM 版 本 中 可 能 会 修改 , 直 
接 使 用 有 风险 。 
其 实 ， 指 令 文 件 就 是 以 JSON (JavaScript object notation ) 格式 编写 的 指令 集合 ， 如 下 所 示 。 
{ 
/ /模式 匹配 的 方式 ， 类 + 方法 + 签名 
match: "java.dingo.Dango.*", 


enable: jit 


} 


在 上 面 的 例子 中 ， 禁 用 了 对 java.dingo.Dango.* 类 中 所 有 方法 的 优化 ， 只 保留 的 JIT 编 
译 ， 这 是 因为 enable 指令 的 值 只 有 jit， 而 没有 指定 hotspot. 
如 果 想 要 在 第 一 次 代码 生成 时 强制 执行 优化 ， 可 以 使 用 如 下 的 配置 。 


{ 
match: "java.dingo.Dango.*", 
// 启 用 代码 生成 的 几 种 原因 
enable: jit, 
je 
preset : opt 
} 
} 


上 面 配置 的 意思 是 ，java .dingo.Dango 类 中 所 有 的 方法 只 能 执行 JIT 编译 ， 但 在 编译 的 
时 候 要 应 用 预 设 的 优化 策略 。 了 cokit 中 包含 有 一 些 预 设 的 优化 策略 ， 其 中 opt 的 意思 是 立即 全 
面 优化 该 方法 。 






















































































相 比 于 运行 一 段 时 间 之 后 , 由 运行 时 根据 收集 到 的 信息 优化 该 方法 ,通过 使 
用 opt 选项 在 系统 第 一 次 编译 方法 时 就 做 全 面 优化 的 效果 未 必 更 好 ， 所 生成 的 
本 地 代码 可 能 有 所 差别 ， 性 能 也 不 尽 相 同 。 过 早 地 优化 方法 ,会 因为 收集 到 的 运 
行 时 信息 不 足 而 难以 做 到 位 ,事实 上 , 运行 时 可 能 已 经 将 这 个 方法 放 到 了 优化 队 
列 中 ， 只 不 过 还 未 执行 而 已 。 强 行 提早 优化 代码 不 仅 会 浪费 宝贵 的 CPU TR, 
还 可 能 会 生成 性 能 不 太 高 的 优化 代码 。 


代码 生成 策略 可 以 用 更 精细 的 方式 加 以 覆盖 , 例如 像 下 面 的 示例 一 样 单独 关闭 某 个 方法 的 优 
化 ， 或 禁止 对 某 个 方法 做 内 联 操作 。 


// 要 使 用 多 条 指令 ， 应 该 使 用 数组 形式 '[ ' . 
[ 
/ /指令 1 
{ 
match: "java.dingo.Dango.*", 
enable: [ jit, hotspot ], //B M JIT 和 优化 
hotspot: { 
fusion_regalloc : false; // 禁 用 图 融合 优化 
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Fo 
jit_inline : false，// 禁 用 JIT AR 
中 


// 指 令 2 

{ 
match: [ "java.lang.*", "com.sun.*" ], 
enable: jit , 
jit: { 


// 复 制 opt # RA preset 值 ， 例 如 强制 TIT 执行 优化 ， 但 禁用 内 联 
preset : opt, 
opt_inline : false, 
by 
pe 


// 指 令 3 

{ 
match: "com.oracle.*", 
// 强 制 优化 器 对 java.util 包 下 类 的 方法 做 内 联 优化 
/ /强制 优 化 禁止 对 com. sun 包 下 的 类 的 方法 做 内 联 优化 
inline: [ "4+java.util.*", "-com.sun.*" J- 


} 


] 

> 在 实际 操作 方面 ， 可 以 通过 指令 文件 来 控制 JRockit 代码 生成 策略 的 每 个 部 

分， 以 及 单独 的 优化 ， 但 对 于 指令 文件 的 名 字 和 指令 的 名 字 ， 却 没有 相关 的 说 明 
文档 。 因 此 指令 文件 是 追踪 问题 的 好 帮手 ， 但 千 万 不 要 滥用 。 








建议 在 使 用 指令 文件 时 附加 -xverbose: opt 选项 以 确保 JVM 读 取 并 应 用 了 该 文件 。 


2.8 小 结 


本 章 简 要 介绍 了 运行 时 环境 的 代码 生成 , 以 常见 问题 引入 代码 生成 的 主题 ,比较 了 自 适 应 编 
译 和 项 态 编译 的 优 劣 ， 并 详细 阐述 了 JVM 中 的 代码 生成 。 

本 章 还 介绍 了 Java 字 节 码 的 各 个 方面 以 及 优 缺 点 ， 讲 解 了 相关 技术 是 如 何 加 速 Java 程序 i 
行 的 ， 并 比较 了 解释 运行 和 编译 运行 的 优 劣 。 

此 外 ,本章 还 阐述 了 自 适 应 运行 时 所 过 到 的 一 些 问题 , 包括 如 何 启用 新 生成 的 代码 以 及 JVM 
如 何 “ 赌 ”性 能 。 本 章 提 到 了 编译 速度 和 执行 速度 的 等 式 , 它 取 决 于 方法 是 否 够 热 , 并 讲解 了 JVM 
做 各 种 优化 的 前 提 假 设 ， 以 及 优化 编译 器 如 何 工作 等 。 

本 章 最 后 介绍 了 JRockit 虚拟 机 的 代码 流水 线 及 其 优化 过 程 ， 并 用 一 个 综合 例子 来 说 明 方法 
是 如 何 编 译 为 本 地 代码 的 。 本 章 的 末尾 介绍 了 如 何 通 过 指令 文件 和 命令 行 参 数 来 控制 JRockit 的 
代码 生成 行为 。 

下 一 章 将 介绍 自 适应 运行 时 的 男 一 个 重要 组 成 部 分 一 一 内 存 管理 系统 和 垃圾 回收 相关 技术 。 
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本 章 介绍 了 Java 运行 时 中 的 自动 自 适应 内 存 管理 ， 回 顾 了 垃圾 回收 的 技术 背景 和 自动 内 存 
管理 发 展 史 ， 此 外 还 对 比 了 自动 内 存 管理 和 静态 内 存 管理 的 优 劣 。 
本 章 主要 内 容 如 下 : 
口 自动 自 适应 内 存 管 理 的 概念 及 相关 问题 
口 垃圾 回收 器 的 工作 原理 (算法 与 实现 ) 
口 如 何 实现 一 个 高 效 、 可 伸缩 的 垃圾 回收 器 
口 吞吐 量 与 延迟 
口 为 对 象 分 配 内 存 时 的 问题 ， 以 及 高 效 分 配 内 存 的 算法 
口 最 重要 的 内 存 管理 相关 的 JavaAPI， 例 如 java.lang.ref 包 中 的 相关 类 
Q JRockit Real Time 产品 与 确定 式 垃 圾 回收 
O 编写 GC 友好 的 Java 代码 的 要 点 ， 以 及 相关 的 陷阱 和 伪 优 化 
口 如 何 使 用 最 基础 的 命令 行 参数 控制 内 存 子 系统 


3.1 自动 内 存 管理 


自动 内 存 管理 (automatic memory management ) 是 指 无 须 使 用 老式 的 内 存 释 放 操作 ， 例 如 
free 操作 符 ， 就 可 以 自动 回收 废弃 对 象 占用 的 内 存 的 垃圾 回收 技术 。 其 实 ， 自 动 内 存 管理 并 不 
是 什么 新 生 事物 ， 其 发 展 史 几乎 与 现代 计算 机 科学 一 样 长 ， 最 早出 现 于 早期 Lisp Machine 中 使 
用 的 引用 计数 方法 。 自 那 之 后 ,在 引用 计数 方法 之 外 ， 又 发 展 出 几 种 不 同 的 堆 管 理 策略 。 到 目前 
为 止 , 大 部 分 自动 内 存 管理 系统 使 用 的 都 是 引用 跟踪 技术 ， 即 执行 垃圾 回收 时 沿 着 对 象 的 引用 关 
系 遍 历 堆 中 对 象 ， 以 确定 哪些 需要 回收 ， 哪 些 需要 保留 













































































GS 在 本 章 中 , HE (heap) 特 指 在 使 用 垃圾 回收 的 环境 中 , 所 有 用 于 存储 对 象 的 、 
~ 非 线 程 局 部 的 内 存 空间 (non-thread local memory ) 。 
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3.1.1 自 适 应 内 存 管理 


正如 前 一 章 介 绍 的 ， 从 优化 的 角度 讲 ， 程 序 运行 过 程 中 JVM 的 具体 行为 和 运行 时 反馈 信息 
是 非常 重要 的 ， 而 JRockit 的 一 大 创举 就 是 将 基于 运行 时 反馈 的 自 适应 优化 从 代码 生成 推广 到 所 
有 的 运行 时 子 系统 ， 本 章 所 要 介绍 的 内 存 管理 系统 就 是 自 适应 优化 的 受益 者 之 一 。 

Fig MAGEE (adaptive memory menagement ) 是 指 主要 通过 运行 时 反馈 来 调整 内 存 管理 
系统 的 行为 。 自 适应 内 存 管 理 是 自动 内 存 管理 的 一 个 特例 ,而 自动 内 存 管 理 是 指使 用 某 些 垃圾 回 
收 技术 来 管理 内 存 , 使 用 户 无 须 再 显 式 地 清理 无 用 对 象 , 内 存 管 理 系统 会 自动 检测 并 释放 这 些 无 
用 对 象 所 占用 的 资源 。 

出 于 性 能 考虑 , 自 适 应 内 存 管理 必须 要 正确 利用 运行 时 反馈 ,这 其 中 包括 修正 垃圾 回收 策略 ， 
自动 缩放 堆 大 小 ， 以 适当 的 时 间 间 隔 整理 内 存 碎片 ， 以 及 判断 何 时 stop the world (STW ) 等 。 
STW 是 指 暂停 正在 执行 的 Java 应 用 程序 ， 转 而 执行 垃圾 回收 的 某 些 操作 。 


3.1.2 ”自动 内 存 管理 的 优点 


自动 内 存 管 理 最 大 的 优点 就 是 可 以 加 快 软件 开发 的 速度 。 众 所 周知 , 进行 多 线程 编程 时 常常 
会 出 现 内 存 分 配 错 误 、 缓 冲 区 溢出 和 内 存 泄 漏 等 问题 ， 而 它们 偏偏 又 很 难 调试 排查 。 当 因为 这 种 
问题 而 导致 崩溃 时 , 程序 往往 在 生产 环境 已 经 运行 了 很 入 , 而 造成 月 演 的 原因 可 能 只 是 内 存 分 配 
时 一 个 字 节 的 偏差 .造成 了 另 一 个 无 关 的 对 象 被 错误 地 释放 掉 。 

Java 编程 语言 的 内 建 机 制 保证 了 使 用 Java 编程 时 不 会 出 现 内 存 分 配 和 缓冲 区 溢出 问题 ， 其 
中 自动 内 存 管理 解决 了 内 存 分 配 问题 ,Java 运行 时 系统 则 解决 了 缓冲 区 溢出 的 问题 ， 例 如 ， 当 发 
生 数 组 越界 的 问题 时 会 抛 出 ArrayIndexOutOfBoundsException 异常 。 

不 过 ， 即 使 使 用 了 垃圾 回收 技术 ， 也 难以 彻底 根除 内 存 泄漏 ， 所 以 现代 JVM 都 提供 几 种 方 
法 来 检测 是 否 存在 内 存 泄漏 ， 而 Java 本 身 也 可 以 帮助 程序 员 解 决 这 个 问题 。 就 JRockit Kik, 
JRockit Mission Control 套件 中 包含 了 一 个 可 以 以 较 小 的 开销 检测 内 存 泄漏 的 工具 ,这 是 因为 JVM 
在 执行 垃圾 回收 的 时 候 就 会 收集 到 很 多 有 用 的 信息 ， 可 以 用 于 检测 内 存 泄漏 。 第 10 章 会 详细 介 
绍 内 存 泄漏 检测 工具 (memory leak detector tool ) 的 相关 内 容 。 












































































































































































































































我 们 认为 ， 内 建 的 自动 内 存 管理 系统 及 更 短 的 软件 开发 周期 ， 是 Java 得 以 
广泛 推广 的 主要 原因 之 一 ， 而 使 用 了 自动 内 存 管 理 后 , 复杂 的 服务 器 端 应 用 程序 
也 的 确 可 以 减少 崩溃 的 次 数 。 





此 外 ， 自 适应 内 存 管理 可 以 根据 应 用 程序 的 具体 运行 状态 , 适时 地 修正 垃圾 回收 策略 , 例如 
改变 执行 垃圾 回收 任务 的 线程 数量 或 其 他 与 垃圾 回收 相关 的 参数 。 相 比 之 下 , 第 2 章 介 绍 的 自 适 
应 代码 生成 也 会 利用 运行 时 反馈 ,例如 只 优化 热 方法 ， 对 冷 方法 置之不理 ， 直 到 它们 变 热 。 
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3.1.3 自动 内 存 管理 的 缺点 


对 自动 内 存 管理 的 争议 主要 集中 在 它 会 降低 应 用 程序 的 执行 效率 , 这 对 某 些 类 型 的 应 用 程序 
来 说 是 无 法 接受 的 。 之 所 以 会 降低 执行 效率 , 是 因为 自动 内 存 管 理 使 得 应 用 程序 的 响应 时 间 带 有 
高 度 的 不 确定 性 。 为 了 避免 这 个 问题 ，JVM 做 了 大 量 的 优化 工作 以 达到 期 望 的 性 能 

事实 上 , 将 内 存 管理 的 任务 交 由 运行 时 负责 确实 会 降低 效率 , 但 现在 这 已 经 不 是 什么 大 问题 

来 说 的 确 是 这 样 。 

其 实 ， 影 响 垃 圾 回收 器 工作 时 间 长 短 的 主要 因素 是 堆 中 存活 对 象 (live object) 的 总 数量 ， 
而 不 是 堆 的 天 小 。 如 果 存 活 对 象 特别 多 的 话 , 无 论 使 用 哪 种 算法 都 会 有 较 长 的 执行 时 间 。 如 果 程 
序 员 手动 管理 内 存 ， 处 理 大 量 存活 对 象 时 可 能 问题 会 少 些 ,但 实际 编码 的 时 候 ， 难 以 保证 绝 不 犯 
错 ， 况 且 在 存在 大 量 存活 对 象 时 ， 手 动 执 行 垃圾 回收 未 必 就 比 内 存 管 理 系统 干 得 好 。 

确实 , 使 用 垃圾 回收 系统 仍然 可 能 会 产生 内 存 泄漏 。 如 果 应 用 程序 错误 地 保存 了 很 多 本 应 被 
回收 掉 的 对 象 的 引用 ,这 些 对 象 就 会 被 认为 是 存活 对 象 ， 也 就 不 会 被 回收 。 常 见 的 内 存 汇 漏 的 例 
了 就 是 对 缓存 的 错误 实现 ， 例 如 java.util.HashMap， 即 便 将 所 有 对 象 都 放 到 HashMap HF, 
它 也 不 会 抛 出 异常 ， 但 会 造成 内 存 泄漏 ， 因 为 系统 无 法 判断 出 HashMap 中 持 有 的 某 个 键 值 对 对 
象 其 实 已 经 没 用 了 ， 只 是 被 错误 地 保存 了 引用 而 已 。 


3.2 SE STEAL 


在 介绍 垃圾 回收 算法 之 前 , 还 需要 讲解 一 下 对 象 分 配 和 释放 , 我 们 需要 清楚 地 知道 堆 中 的 哪 
些 对 象 会 被 回收 掉 。 此 外 ， 本 闻 会 简要 介绍 对 象 是 如 何 分 配 以 及 如 何 回收 的 。 


3.2.1 ”对象 的 分 配 与 释放 


一 般 来 说 , 为 对 象 分 配 内 存 时 , 并 不 会 直接 在 堆 上 划分 内 存 , 而 是 先 在 线程 局 部 缓冲 ( thread 
local buffer ) 或 其 他 类 似 的 结构 中 找 地 方 放置 对 象 ， 然 后 随 着 应 用 程序 的 运行 、 新 对 象 的 不 断 分 
配 , 垃圾 回收 逐次 执行 , 这 些 对 ee 中 保存 , 也 有 可 能 会 当 作 垃圾 被 释放 掉 。 

为 了 能 够 在 堆 中 给 新 创建 的 对 象 找 一 个 合适 的 位 置 , 内 存 管 理 系统 必 必须 知道 堆 中 有 哪些 地 方 
是 空 闪 的 ， 即 还 没有 存活 对 象 占用 。 内 存 管理 系统 使 用 空 SA 串联 起 内 存 中 可 
用 内 存 块 的 链表 ， 来 管理 内 存 中 可 用 的 空闲 区 域 ， 并 按照 革 个 维度 的 优先 级 排序 。 

在 空闲 列表 中 搜索 足够 存储 新 对 象 的 空闲 块 时 , 可 以 选择 大 小 最 适合 的 空闲 块 , 也 可 以 选择 
第 一 个 放 得 下 的 空闲 块 。 这 其 中 会 用 到 几 种 不 同 的 算法 去 实现 ， 各 有 优 劣 ， 后 文 会 详细 讨论 。 


3.2.2 ”碎片 与 整理 


在 实际 应 用 中 , 仅仅 跟踪 空闲 空间 是 不 够 的 , 还 有 一 些 其 他 问题 要 处 理 , 碎片 化 ( fragmentation ) 
就 是 内 存 管 理 器 要 面 对 的 一 大 难题 。 当 死 对 象 (dead object ) 被 垃圾 回收 需 清 除 后 ， 就 会 在 堆 上 
留 下 一 个 个 的 孔洞 (hole )。 
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碎片 化 问题 大 大 制约 了 垃圾 回收 的 伸缩 性 ， 严 重 的 时 候 ， 即 便 堆 中 还 有 大 量 空闲 空间 可 用 ， 
却 无 法 为 新 对 象 找到 合适 的 存储 位 置 。 因 为 没有 足够 大 的 连续 空间 ,也 就 是 说 孔洞 不 够 大 ， 放 不 
下 新 对 象 。 这 时 ， 为 了 能 够 清理 出 足够 大 的 空间 来 放置 新 对 象 ， 运 行 时 系统 一 般 会 频繁 GC， 却 
仍旧 无 法 为 新 对 象 腾 出 足够 大 的 连续 空间 ， 于 是 运行 时 系统 陷入 了 死 循环 。 

下 图 展示 了 堆 中 几 个 对 象 的 分 布 。 




















上 图 中 , 堆 中 空间 已 被 存活 对 象 占 满 ， 对象 A 占据 了 2 个 存储 单元 ， 其 他 对 象 各 占 一 个 。 当 
垃圾 回收 开始 的 时 候 ， 有 两 个 对 象 A 和 E 是 可 达 的 (reachable )， 依 据 其 引用 关系 ， 各 自 形成 了 
独立 的 对 象 关系 图 ， 分 别 是 ABCD 和 EFGH。 

此 时 ， 如 果 将 指向 对 象 E 的 引用 赋值 为 null， 则 E 及 其 所 指向 的 对 象 FGH 都 会 被 当 作 垃 圾 
回收 掉 。 然 后 ， 堆 上 的 对 象 分 布 如 下 所 示 。 









































经 过 垃圾 回收 后 , 堆 上 总 共有 4 个 空闲 的 存储 单元 , 但 即便 如 此 , 还 是 无 法 放下 一 个 体积 大 于 
1 的 对 象 . 此 时 , 如 果 内 存 管理 器 还 试图 为 体积 为 2 的 对 象 分 配 内 存 , 就 会 抛 出 OutofMemoryError 
错误 ， 这 就 是 内 存 碎 片 的 问题 。 

因此 , 内 存 管 理 系统 为 了 能 够 腾 出 足够 大 的 连续 内 存 空间 ， 就 会 采取 一 些 特殊 措施 ， 这 个 过 
程 称 为 整理 ( compaction )。 在 垃圾 回收 周期 中 , 整理 是 一 个 独立 的 阶段 , 在 该 阶段 中 会 将 经 过 垃 
圾 回收 后 的 存活 对 象 移 到 一 起 。 

下 图 是 经 过 整理 之 后 的 堆 。 
































ME, 堆 上 已 经 有 了 一 个 大 小 为 4 的 连续 存储 空间 ， 可 以 存放 以 往 因 内 存 不 足 而 无 法 存放 的 
对 象 了 。 

但 遗憾 的 是 , 一 般 情 况 下 , 整理 是 一 个 STW ( stop the world ) 式 的 操作 , 并 发 执行 困难 较 大 ， 
本 章 会 在 后 面 介绍 一 些 可 以 提升 效率 的 办 法 (第 5 章 和 第 13 章 将 做 一 些 扩展 介绍 )。 
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执行 整理 操作 时 , 会 遍历 对 象 的 引用 关系 图 , 并 假设 互相 引用 的 对 象 很 有 可 能 会 被 依次 访问 
到 ,所 以 垃圾 回收 费 会 尽量 将 有 引用 关系 的 对 象 紧 挨 着 放 在 一 起 , 这 样 做 是 为 了 可 以 更 好 地 利用 
缓存 。 同 时 ， 如 果 对 象 的 生命 周期 差不多 的 话 ， 就 可 以 在 垃圾 回收 后 得 到 更 大 的 连续 空间 。 

各 种 垃圾 回收 算法 可 以 不 同 程度 上 抑制 内 存 碎 片 化 的 进程 《例如 使 用 分 代 垃 圾 回收 )， 或 者 
实现 自动 整理 (例如 暂停 并 复制 )， 这 些 内 容 将 在 后 文 详细 介绍 。 








3.3 垃圾 回收 算法 


实际 上 , 自动 内 存 管 理 就 是 持续 跟踪 应 用 程序 中 的 存活 对 象 , 即 有 哪些 对 象 被 其 他 正在 使 用 
的 对 象 所 引用 ,没有 被 使 用 的 对 象 会 被 垃圾 回收 器 回收 掉 。 在 本 文中 ,存活 对 象 和 正在 使 用 的 对 
象 会 交替 使 用 ， 它 们 是 一 个 意思 。 

但 事实 上 , 给 垃圾 回收 技术 划分 类 型 并 不 容易 , 因此 , 为 了 避免 在 学 术 界 挑 起 争执 , 在 这 里 ， 
引用 计数 垃圾 回收 ( reference counting garbage collection ) 之 外 的 技术 都 被 归 为 引用 跟踪 垃圾 回收 
(tracing garbage collection )。 引 用 跟踪 垃圾 回收 是 指 ， 当 执行 垃圾 回收 时 ， 为 存活 对 象 建立 一 个 
引用 关系 图 ， 并 回收 掉 那 些 不 可 达 (unreachable ) 对 象 。 除 此 之 外 的 另 一 种 垃圾 回收 技术 ， 就 是 
引用 计数 垃圾 回收 。 


3.3.1 引用 计数 


在 引用 计数 算法 中 ， 运 行 时 会 记录 下 某 个 时 刻 有 多 少 存活 对 象 引 用 了 某 个 指定 对 象 。 

当 某 个 对 象 引 用 计数 降 为 0 时 , 即 没 有 存活 对 象 引 用 这 个 对 象 时 , 就 可 以 将 其 回收 了 。 该 方法 
最 初 应 用 于 Lisp 语言 的 实现 ， 从 当时 的 情况 看 效率 不 错 ， 只 不 过 该 方法 有 一 个 显著 缺陷 ， 那 就 是 
无 法 回收 带 有 循环 引用 结构 的 对 象 , 即 如 果 两 个 对 象 都 引用 了 对 方 , 却 没有 其 他 对 象 引 用 它们 , 则 
尽管 它们 已 经 是 不 可 达 对 象 了 ， 但 由 于 引用 计数 始终 不 为 0 却 不 会 被 回收 掉 ， 从 而 造成 内 存 泄 漏 。 
通过 上 面 的 描述 可 以 看 到 ,引用 计数 的 实现 简单 明了 ， 除 此 之 外 , 还 有 一 大 优点 就 是 ,垃圾 
回收 器 可 以 立即 回收 掉 引 用 计数 为 0 的 对 象 。 

但 是 ,实时 更 新 对 象 的 引用 计数 却 代价 不 菲 ,尤其 是 在 需要 使 用 同步 操作 的 并 行 运 行 环境 中 。 
目前 ， 市 面 上 还 没有 以 引用 计数 作为 主要 垃圾 回收 方法 的 商用 JVM 实现 ， 不 过 ， 将 来 可 以 将 引 
用 计数 应 用 于 JVM 的 子 系统 或 应 用 层 简单 协议 的 实现 。 


3.3.2 引用 跟踪 


引用 跟踪 垃圾 回收 的 概念 其 实 很 简单 。 首先, 将 应 用 程序 中 所 有 可 见 对 象 标 记 为 存活 ,然后 
递归 标记 可 以 通过 存活 对 象 访问 的 对 象 。 

当然 ， 在 某 些 情况 下 ， 这 个 过 程 可 能 会 无 穷 无 尽 。 

在 后 文中 , 根 集合 (rootset ) 专 指 上 述 搜索 算法 的 初始 输入 集合 ， 即 开始 执行 引用 跟踪 时 的 
存活 对 象 集合 。 一 般 情 况 下 , 根 集合 中 包括 了 因为 执行 垃圾 回收 而 暂停 的 应 用 程序 的 当前 栈 帧 中 
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所 有 的 对 象 , 包含 了 可 以 从 当前 线程 上 下 文 的 用 户 栈 和 寄存 器 中 能 得 到 的 所 有 信息 。 此 外 , 根 集 
合 中 还 包含 全 局 数据 ,例如 类 的 静态 属性 。 简 单 来 说 就 是 , 根 集合 中 包含 了 所 有 无 须 跟 踪 引 用 就 
可 以 得 到 的 对 象 。 

后 文 会 详细 介绍 如 何 标识 出 根 集合 的 内 容 。 

1. 标记 -清理 

标记 -清理 算法 是 目前 商用 JVM 中 垃圾 回收 器 的 实现 基础 , 实现 该 算法 时 可 以 选择 
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展 性 又 好 。 下 面 是 标记 -清理 算法 的 伪 代 码 。 


标记 
将 根 集合 中 的 一 个 对 象 添加 到 队列 中 
遍历 队列 中 的 对 象 ， 对 每 个 对 象 义 : 


将 又 标记 为 可 达 的 
将 X 所 持 有 的 引用 添加 到 队列 中 
清理 
遍历 堆 中 每 个 对 象 又: 


如 果 没有 被 标记 为 可 达 的 ， 就 将 其 回收 
通过 前 面 对 算 法 和 引用 跟踪 技术 的 介绍 ， 可 以 知道 标记 -清理 算法 的 计算 复杂 度 是 以 堆 中 存 
活 对 象 (标记 ) 和 堆 的 实际 大 小 (清理 ) 为 自 变 量 的 函数 。 
下 图 是 执行 标记 之 前 堆 中 对 象 。 



































标记 之 前 
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执行 标记 操作 时 ， 首 先 要 遍历 存活 对 象 图 (live object graph )， 然 后 遍历 所 有 堆 中 对 象 ， 识 
别 出 未 标记 的 对 象 。 但 实际 操作 的 时 候 , 并 不 一 定 非 要 这 样 。 近 年 来 研究 人 员 已 经 想 出 了 一 些 办 
法 来 加 速 这 个 过 程 ， 并 尽量 使 之 可 以 并 行 。 

下 面 的 示意 图 展示 了 标记 阶段 结束 之 后 的 情况 , 所 有 从 根 集合 开始 的 可 达 对 象 都 已 经 被 标记 
了 ， 而 对 象 E 由 于 无 法 从 根 集 合 访问 到 所 以 没有 被 标记 。 
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标记 -清理 算法 的 基本 假设 是 , 对 象 关系 图 中 , 对 象 间 的 引用 关系 不 会 在 标记 阶段 发 生变 化 。 
这 就 是 说 , 在 执行 标记 操作 时 ， 需 要 暂停 所 有 可 能 修改 对 象 引用 关系 的 应 用 程序 代码 ， 例 如 为 属 
性 重新 赋值 。 但 对 于 现今 的 应 用 程序 来 说 ,使 用 大 量 数据 对 象 的 情况 非常 常见 ， 所 以 只 靠 这 样 的 
假设 是 难以 实现 高 效 JVM 的 。 

在 下 面 的 示意 图 中 ， 对 象 E 已 经 被 回收 掉 了 。 
































| 清理 之 后 
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简单 实现 标记 -清理 算法 时 ， 对 于 每 个 可 达 对 象 ， 一 般 都 会 使 用 一 个 标记 位 ( mark bit ) 来 表 
示 该 对 象 是 否 已 经 被 标记 过 。 为 对 象 分 配 内 存 时 , 为 了 满足 对 齐 要 求 , 其 起 始 地 址 一 般 都 是 偶数 ， 
因此 ， 对 象 指 针 的 最 低位 总 是 0， 正 适合 用 来 做 标记 位 。 
标记 -清理 算法 的 一 个 变种 是 可 以 并 行 运行 的 三 色 标记 -清理 〈tri-coloring mark and sweep )。 
简单 来 说 就 是 , 不 再 为 每 个 对 象 设置 一 个 二 进 制 的 标记 位 ， 而 是 使 用 一 个 带 有 3 个 可 选 值 的 变量 
来 表示 对 象 的 标记 状态 , 具体 值 为 和 白色、 灰色、 黑色 。 其 中 , 标记 为 白色 的 对 象 表示 是 已 死 对 象 ， 
将 会 被 回收 掉 ， 那 些 不 包含 指向 白色 对 象 的 引用 的 对 象 被 标记 为 黑色 ， 最 初 没 有 黑色 对 象 存在 ， 
标记 算法 需要 找到 它们 。 黑 色 对 象 不 可 以 引用 白色 对 象 。 灰 色 对 象 是 存活 对 象 , 但 其 所 指向 的 对 
象 的 状态 未 知 。 在 标记 阶段 开始 的 时 候 , 根 集合 中 的 对 象 被 标记 为 灰色 ,以 便 通过 遍历 对 象 引 用 
找到 所 有 存活 对 象 。 其 他 所 有 的 对 象 被 标记 为 白色 。 
三 色 标 记 算 法 的 伪 代 码 实现 如 下 。 
标记 
默认 将 所 有 对 象 标 记 为 白色 
将 根 集合 中 的 对 象 标 记 为 灰色 
if 灰色 对 象 exists: 
for x in KEI: 
for y in (x 引用 的 白色 对 象 ) :将 y 标记 为 灰色 
if x 所 有 的 引用 都 指向 另 一 个 灰色 对 象 : 
将 x 标记 为 黑色 
清理 
回收 所 有 白色 对 象 
这 里 的 主体 思想 就 是 ,即使 在 标记 过 程 中 对 象 的 引用 关系 发 生 了 改变 ， 例 如 分 配 内 存 并 修改 
对 象 属性 的 值 ， 只 要 黑色 对 象 不 引用 白色 对 象 ， 垃 圾 回收 器 就 可 以 继续 正常 工作 。 一 般 情 况 下 ， 
标记 操作 是 跟 应 用 程序 源 代码 无 关 的 , 所 以 内 存 管理 器 可 以 在 运行 应 用 程序 时 帮助 完成 颜色 标记 
的 工作 ， 例 如， 在 为 对 象 分 配 内 存 后 ， 立 即 对 其 标记 颜色 。 
除 上 述 算法 外 , 还 有 一 些 并 行 标记 -清理 算法 变种 , 这 部 分 内 容 超 出 了 本 书 范畴 , ANP 
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2. 暂停 -复制 

暂停 -复制 〈 stop-copy ) 是 一 种 特殊 的 引用 跟踪 垃圾 回收 技术 ， 其 运行 方式 简单 有 效 ， 但 对 
于 现实 生产 环境 中 普遍 使 用 的 大 内 存 容 量 来 说 ， 不 太 实用 。 

使 用 暂停 -复制 算法 需要 将 堆 划 分 成 两 个 同样 大 小 的 分 区 ， 而 在 应 用 程序 运行 时 只 能 使 用 其 
中 一 个 分 区 , 这 样 才能 保证 有 足够 大 的 空间 来 存储 从 垃圾 回收 中 存活 下 来 的 对 象 , 但 这 种 方式 实 
在 太 浪 费 内 存 。 该 算法 的 最 简 实现 是 从 根 集合 的 对 象 开始 遍历 正在 使 用 的 分 区 中 的 全 部 存活 对 
象 , 将 标记 为 存活 的 对 象 复制 至 男 一 个 未 使 用 的 分 区 。 在 垃圾 回收 结束 后 , 交换 两 个 分 区 的 角色 ， 
等 待 下 次 垃圾 回收 开始 。 

该 算法 的 优点 是 解决 了 内 存 碎 片 化 可 能 带 来 的 问题 。 执 行 垃 圾 回收 过 程 中 , 将 存活 对 象 复制 
到 另 一 个 分 区 时 , 会 将 其 放 在 找到 的 第 一 个 大 小 合适 的 位 置 。 由 于 对 象 是 按照 忆 历 对 象 引用 关系 
图 的 顺序 摆 放 的 , 所 以 包含 引用 关系 的 对 象 的 位 置 往往 离 得 较 近 , 这 在 很 大 程度 上 缓解 了 垃圾 回 
收 给 系统 缓存 带 来 的 负面 影响 。 

该 算法 的 显著 缺点 是 ， 每 次 垃圾 回收 时 都 必须 将 所 有 存活 对 象 复制 到 另 一 个 未 使 用 的 分 区 。 
当 存 活 对 象 很 多 时 ,开销 很 大 ,而 且 垃 圾 回收 本 身 就 会 对 系统 缓存 带 来 很 大 的 负面 影响 。 更 为 重 
要 的 是 ,运行 应 用 程序 时 只 能 使 用 堆 的 一 半 ， 造 成 了 严重 浪费 。 

















































































































根 集合 
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& RI 空闲 区 域 RI 
空闲 区 域 R2 R2 
垃圾 回收 之 前 垃圾 回收 之 后 









































上 图 展示 了 暂停 -复制 垃圾 回收 的 过 程 。 堆 被 划 为 两 个 分 区 ,在 垃圾 回收 开始 的 时 候 ， 根 集 
合 中 只 包含 对 象 A, 对 象 A 引 用 了 对 象 C。 在 标记 阶段 , 垃圾 回收 器 判断 出 只 有 对 象 A 和 对 象 C 
是 存活 对 象 ， 于 是 将 其 复制 到 分 区 R2， 而 对 象 B 和 对 象 D 作为 已 死 对 象 被 回收 掉 。 对 象 A 和 对 
象 C 在 分 区 R1 中 并 不 相 邻 ,由 于 复制 对 象 时 按照 对 象 引 用 关系 和 先 到 先 得 ( first-come-first-serve ) 
的 策略 被 放 到 了 一 起 。 



































3.3.3 STW 


STW (stop-the-world )， 顾 名 思 义 ， 为 便于 执行 垃圾 回收 而 暂停 所 有 应 用 程序 的 所 有 Java 线 
程 ， 堪 称 垃圾 回收 的 阿 克 琉 斯 之 呈 。 即 使 是 像 标 记 - 清 理 这 种 几乎 可 以 完全 并 行 运 行 的 算法 ， 仍 
然 难以 处 理 垃圾 回收 时 对 象 引 用 关系 发 生变 化 的 情况 。 如 果 想 要 在 执行 垃圾 回收 的 同时 , 还 可 以 
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执行 Java 应 用 程序 ， 并 允许 随意 给 对 象 引 用 赋值 ， 那 么 垃圾 回收 器 和 应 用 程序 之 间 就 需要 某 种 
交互 并 记录 相应 的 信息 , 这 样 才能 正确 完成 垃圾 回收 的 工作 .这 就 涉及 同步 , 也 就 是 说 需要 STW. 
对 于 所 有 涉及 垃圾 回收 和 内 存 管理 的 编程 语言 来 说 ，STW 时 间 的 长 短 非 常 重要 ， 这 也 是 以 这 些 
语言 所 编写 的 程序 在 运行 过 程 所 遇 到 的 延迟 和 不 确定 性 问题 的 主要 原因 之 一 。 

垃圾 回收 可 能 会 移动 堆 上 的 对 象 ,例如 执行 内 存 整理 操作 。 但 原先 指向 这 些 对 象 的 对 象 指针 
的 值 却 并 没有 发 生变 化 , 那么 应 用 程序 再 次 运行 的 时 候 就 会 出 现 错误 ， 所 以 垃圾 回收 器 必须 更 新 
这 些 对 象 指针 的 值 ,将 之 指向 对 象 的 新 位 置 ， 而 更 新 操作 需要 同步 进行 ,防止 对 象 位 置 再 次 发 生 | 
改 恋 。 

简单 实现 的 话 ， 就 是 暂停 应 用 程序 运行 ,使 用 尽 可 能 多 的 线程 执行 垃圾 回收 。 在 恢复 应 用 各 
序 线程 之 前 , 更 新 对 象 指针 的 值 , 但 是 ,这 种 方法 并 不 现实 ， 因 为 现代 服务 器 端 应 用 程序 都 对 响 
应 时 间 有 一定 要 求 ， 像 这 种 需要 暂停 应 用 程序 数 百 毫秒 来 执行 垃圾 回收 的 方法 令 人 无 法 接受 。 因 
此 ， 对 于 那些 对 系统 延迟 有 较 高 要 求 的 应 用 程序 来 说 ， 为 了 能 将 响应 时 间 降 到 最 小 , 垃圾 回收 器 
就 需要 与 应 用 程序 并 发 执行 ,而 且 还 要 能 正确 处 理 执行 垃圾 回收 时 对 象 指针 发 生变 化 的 问题 . 这 
很 难 ， 除 非 应 用 程序 非常 特殊 ， 否 则 没 办 法 完全 绕 过 STW， 因 此 在 实际 生产 环境 下 ， 工 作 重心 
是 尽 可 能 缩短 应 用 程序 的 暂停 时 间 。 

1. 保守 式 与 准确 式 

正如 前 面 提 到 的 虚拟 机 需要 使 用 一 些 额外 的 信息 来 记录 楼 帧 中 对 象 的 存储 位 置 ， 这 样 才能 
在 执行 垃圾 回收 时 正确 构建 根 集合 的 初始 值 , 此 外 , 如 果 某 个 应 用 程序 线程 因 垃 圾 回收 而 暂停 了 
还 需要 明确 该 线程 当前 的 上 下 文 。 

其 实 ,要 想 知道 对 象 间 的 引用 关系 并 不 难 ， 因 为 在 为 对 象 分 配 内 存 时 ,垃圾 回收 器 会 记录 相 
关 信 息 。 如 果 类 X 中 包含 有 对 类 Y 的 引用 ， 则 在 类 X 的 所 有 实例 中 ， 指 向 类 型 Y 的 对 象 的 属性 
具有 相同 的 位 置 偏 移 。 对 于 JVM 来 说 ， 对 象 和 C 语言 中 的 结构 体 没什么 区 别 ， 但 是 垃圾 回收 器 
却 没 法 自动 判断 出 栈 帧 中 对 象 的 位 置 。 

查找 菜 个 线程 暂停 时 的 上 下 文 信息 并 不 复杂 ， 只 需要 使 用 检索 表 (lookup table) 或 搜索 树 
( search tree ) 来 查找 当前 指令 寄存 器 的 指令 是 属于 哪个 Java 方 法 的 即 可 。 方法 涉及 的 对 象 ,一般 
是 作为 传 和 参数 、 方 法 的 返回 值 ， 或 是 对 引用 变量 赋值 操作 ， 此 外 ， 移 动 指令 也 会 在 寄存 器 之 间 
复制 对 象 引用 ,应 用 程序 暂停 时 ,运行 时 系统 无 法 根据 当前 的 上 下 文 回溯 到 对 象 创建 时 的 上 下 文 ， 
但 是 ， 为 了 能 够 正确 地 构建 根 集合 ， 垃 圾 回收 器 却 必须 清楚 地 知道 对 象 的 存储 位 置 。 

简单 实现 的 话 ， 可 以 规定 编译 器 必须 将 对 象 数据 和 非 对 象 数据 ( 例如 整数 ) 分 别 存储 到 指定 
的 寄存 器 或 内 存 位 置 中 。 以 x86 平 台 为 例 ， 可 以 强迫 代码 后 成 器 只 使 用 esi 或 edi 存储 对 象 的 
引用 地 址 ,整数 则 只 能 存储 于 其 他 寄存 器 ; 或 者 规定 将 对 象 存储 于 栈 帧 时 ， 其 位 置 的 偏 移 地 址 必 
须 是 指针 大 小 的 偶数 倍 ( 例如 [esp + 0 * 41 或 Lesp + 2 * 人 4 等) 而 存储 整数 时 ， 偏 移 地 
址 就 必须 是 整数 类 型 长 度 的 奇数 倍 (例如 [esp + 1 * 4] 或 Lesp + 3 * 4] 等 ) 类 似 这 样 的 
规定 保证 了 在 可 以 存储 对 象 的 地 方 只 可 能 存在 有 效 对 象 或 mu11 两 种 值 ， 而 内 存 中 的 其 他 地 方 因 
为 不 存储 对 象 而 根本 不 需要 动用 垃圾 回收 器 ， 从 而 大 大 简化 了 垃圾 回收 器 的 工作 。 但 是 受 限于 
CPU 中 通用 寄存 器 的 数量 ， 寄 存 器 分 配器 不 得 不 使 用 大 量 Spill 技术 来 生成 相关 代码 ， 这 会 对 程 
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序 的 执行 性 能 造成 较 大 影响 ， 对 于 像 x86 这 种 通用 寄存 器 数量 不 多 的 平台 来 说 ， 影 响 尤 甚 ， 因 此 
这 种 方法 并 不 实用 。 

使 用 保守 式 垃圾 回收 器 (conservative garbage collection ) 可 以 绕 过 这 个 问题 ， 这 种 类 型 的 垃 
圾 回收 器 会 将 所 有 看 起 来 像 是 对 象 指针 的 数据 都 当 作 对 象 指针 处 理 。 例 如 ， 像 17 和 4711 这 样 
的 值 可 以 简单 地 认为 是 整数 类 型 的 值 , 但 是 那些 看 起 来 像 是 指针 地 址 的 值 就 必须 要 检查 , A HE 
中 对 应 位 置 的 内 容 。 这 个 过 程 有 较 大 的 性 能 损耗 ， 但 对 于 像 C 语 言 这 样 的 弱 类 型 编程 语言 来 说 ， 
要 想 实现 自动 内 存 管理 就 必须 要 有 这 个 过 程 。 此 外 , 保守 式 垃 圾 回收 需 还 存在 意外 持 有 垃圾 对 象 
和 无 意义 移动 对 象 的 问题 。 

Java 使 用 的 是 准确 式 垃圾 回收 器 (exact garbage collector )， 可 以 将 对 象 指 针 类 型 数据 和 其 他 
类 型 的 数据 区 分 开 , 只 需要 将 元 数据 信息 告知 垃圾 回收 器 即 可 ,这些 元 数据 信息 ,一 般 可 以 从 Java 
方法 的 代码 中 得 到 。 

2. 存活 对 象 图 

JRockit JVM 使 用 了 称 为 存活 对 象 图 (livemap ) 的 数据 结构 来 保存 一 些 元 数据 ， 例 如 对 象 保 
存在 哪些 寄存 器 和 栈 帧 中 。 此 外 , 每 个 对 象 指针 中 都 使 用 了 一 个 标志 位 来 表示 该 对 象 指针 的 值 是 
内 部 指针 (internal pointer )， 还 是 真实 对 象 的 起 始 位 置 。 由 于 内 部 指针 指向 对 象 的 内 部 数据 ， 指 
向 的 是 堆 中 的 位 置 ， 而 不 是 对 象 头 (object header )。 当 内 部 指针 的 基 对 象 (base object) 在 内 存 
中 的 位 置 发 生变 化 时 , 必须 要 更 新 内 部 指针 , 但 对 象 指针 不 是 对 象 , 因此 不 需要 移动 它们 的 位 置 。 

内 部 指针 的 典型 用 途 是 遍历 数组 。 在 Java 编程 语言 中 ， 不 存在 内 部 指针 ,但 编译 器 可 以 为 
相关 代码 生成 内 部 指针 以 加 速 程序 运行 。 以 下 面 的 代码 为 例 : 

for (int i = 0; i < array.length; i++) { 


sum += array[i]; 


} 
将 其 编译 为 如 下 形式 的 代码 : 


for (int ptr = array.getData(); 
ptr < sizeof(int) * array.length; 
ptr += sizeof(int)) { 
sum += *ptr; 
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} 


在 上 面 的 示例 中 ， 由 于 数组 对 象 array 的 位 置 可 能 会 因 垃 圾 回收 而 移动 ， 所 以 为 了 保证 程 
序 的 正确 运行 ， 垃 圾 回收 器 需要 知道 ptr 是 一 个 指向 数组 元 素 的 内 部 指针 ， 当 数组 对 象 array 
被 移动 时 ， 需 要 更 新 内 部 指针 ptr 的 值 。 由 于 无 须 在 每 次 迭代 路 取 数 组 元 素 的 指针 值 ， 程 序 
的 运行 效率 会 更 高 一 些 。 

因此 ,将 对 象 指针 和 内 部 指针 存储 在 元 数据 ( 即 存活 对 象 图 ) 中 ， 有 助 于 执行 垃圾 回收 。 下 
面 以 计算 数组 元 素 之 和 的 函数 来 说 明 对 象 指针 和 内 部 指针 的 使 用 方式 。 
































public static Integer sum(Integer array[]) { 
Integer sum = 0; 
for (int i = 0; i < array.length; i++) { 


sum += array[i]; 
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} 


return sum; 


} 
TE x86-64°E GE, JRockit 会 生成 类 似 下 列 汇 编 代 码 。 




















[SumArray.sum([Ljava/lang/Integer;)Ljava/lang/Integer; 












































7a8c90: push rox 7a8cc7: jle 0x7a8cf7 
7a8c91: push rbp 大 一 一 一 一 一 rsib, rbxb] 
7a8c92: sub rsp,8 7a8cc9 : mov [rsp+0] , rox 
7a8c96: mov rbx,rsi 7a8ccd: mov ebx, r9d 
一 一 一 一 一 [rsib, rbxb] 大 一 一 一 一 一 rsib, [rsp+0]b 
7a8c99: test eax, [0x7fffe000] 7a8cd0: mov r9d, [rsi+8 
*--B-- [rsib, rbxb] *--B-- [rsp+0]b] 
7a8ca0: mov ebp, [rsi+8] 7a8cd4: test eax, [0x7 fffe000] 
7a8ca3: test ebp, ebp 7a8cdb: mov r11, [rsp+0 
7a8ca5: jg 7a8cb1 Keiti rllb, [rsp+0]b 
Raa nothing live] 7a8cdf: mov ecx, [r11+4*rbx+16] 
7a8ca7: xor rax,rax *--B-- [rexb, [rsp+0]b 
past nothing live] 7a8ce4: add r9d, [rcx+8 
7a8caa: call Integer.valueOf (I) 7a8ce8: mov eax, r9d 
Graan [tsib] Rees) [rsp+0]b] 
7a8caf: jmp Ox7a8c£7 7a8ceb: call Integer.valueOf (I) 
*--B-- [rsib, rbxb] *C-B-- [rsib, [rsp+0]b] 
7a8cb1: mov r9d, [rsi+16] 7a8cf0: add ebx, 1 
类 一 一 一 一 一 r9b, rbxb] 7a8cf3: cmp ebx, ebp 
7a8cb5: mov eax, [r9+8] Ja8cf5: jl 7a8cd0 
人 rbxb] *--B-- [rsib] 
7a8cb9: call Integer.valueOf (I) 7a8cf7: pop rex 
*C---- [rsib, rbxb] 7a8cf8: pop rbp 
7a8cbe: mov r9d,1 7a8cf9 : pop rbx 
Ja8cc4: cmp rbp,1 7a8cfa: ret 
以 上 汇编 代码 中 已 — 活 对 象 图 信息 来 帮助 理解 代码 的 整体 含义 , 因此 读者 无 须 弄 清 
每 一 行 汇编 代码 的 具体 合 个 示例 中 , 代码 的 优化 程度 并 不 高 ， 因 此 没有 生成 之 前 所 描述 
的 内 部 指针 ， 此 外 ，Iinteger.valueof 方法 也 没有 被 内 联 进来 。 











汇编 代码 中 的 存活 对 象 图 信息 可 以 告知 垃圾 回收 器 在 某 个 时 间 点 上 ， 对 象 存储 在 哪些 寄存 吕 
和 栈 帧 中 。 例 如 , 调用 Integer.valueof 方法 时 会 返回 一 个 整数 对 象 , 按照 调用 约定 ， 这 个 对 
象 会 存储 在 rsi 寄存 器 中 。( 其 中 ，rsi 后 面 的 b 表示 是 一 个 基 指 针 ， 而 不 是 内 部 指针 。) 

bat 进入 一 个 方法 的 调用 栈 帧 后 ， 存 活 对 象 图 信息 中 还 cet rsi 和 rpx 寄存 器 中 包含 
对 象 。 这 个 信息 紧 跟 在 地 址 为 7a8c96 的 代码 mov rbx, rsi 后 面 ， 这 条 指令 会 将 人 参 从 rsi 
放 到 roxo 








然 有 效 。 出 于 性 能 上 的 考虑 ， 编 译 器 会 将 调用 Integer.valuedf 方法 的 结果 保 


按照 JRockit 的 调用 约定 ， 寄 存 器 vox 是 被 调用 者 保存 的 ， 在 调用 结束 后 仍 
存在 寄存 器 PP, 使 之 保持 存 活 状 态 9 这 样 就 避 DA 了 使 用 Spill 技术 来 调 配 寄存 器 oF o 
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那么 ， 垃 圾 回收 器 会 在 何 时 开始 执行 STW 式 的 垃圾 回收 呢 ? 垃圾 回收 可 能 发 生 在 任意 时 间 
点 ， 即 每 个 本 地 指令 都 可 能 成 为 挂 起 点 ， 但 给 每 个 本 地 指令 标记 对 象 存活 信息 又 有 很 高 的 成 本 。 
正如 上 面 的 示例 代码 ， 这 不 太 现实 。 

就 JRockit 来 说 ， 只 会 在 某 些 指 令 上 标记 对 象 存活 信息 ， 例 如 在 循环 体 头 部 或 有 多 个 人 口 的 
基本 块 的 头 部 ， 因 为 在 这 些 地 方 无 法 得 知 控制 流 的 走向 。 此 外 , 在 call 指令 处 也 会 标记 对 象 存 
活 信息 ， 这 是 因为 在 计算 栈 信息 时 必须 立即 获取 对 象 的 存活 信息 才能 保证 执行 效率 。 

第 2 章 曾 提 到 过 ， 耻 ockit 是 以 类 似 回 填 的 方式 执行 代码 生成 任务 的 ， 因 此 JVM 必须 能 够 理 
解 并 反 编 译本 地 代码 ， 而 最 初 设 定 这 个 机 制 时 ， 是 为 了 方便 虚拟 机 可 以 在 某 个 操作 系统 线程 中 ， 
从 某 个 指令 地 址 开始 模拟 本 地 指令 的 运行 。 在 此 机 制 下 , 若 无 法 从 某 个 已 暂停 的 线程 的 上 下 文中 
得 到 存活 对 象 图 信息 ，JRockit 就 会 模拟 指令 运行 ， 直 到 发 现 可 用 的 存活 对 象 图 信息 。 这 种 运行 
方式 就 称 为 向 前 滚动 (rollforwarding )。 


| 在 JRcokit R28 版 本 中 ， 向 前 滚动 机 制 已 被 废除 ， 现 在 使 用 的 是 传统 的 、 基 | 



































于 安全 点 (safepoint ) 的 方式 。 











这 种 方式 的 优点 在 于 , 应 用 程序 线程 的 暂停 位 置 不 受 限 制 , 使 用 相关 操作 系统 的 信号 机 制 即 
可 实现 ， 而 且 无 须 在 生成 的 代码 中 添加 额外 的 指令 。 

其 缺点 在 于 , 模拟 指令 运行 也 是 要 花 时 间 的 ， 还 需要 兼顾 到 所 有 支持 的 硬件 平台 ， 且 难以 测 
试 。 因 为 输入 是 个 无 限 集合 ， 而 且 模 拟 运行 本 里 就 易 出 错 。 此 外 ， 支 持 新 硬件 架构 也 颇 为 麻烦 ， 
需要 针对 新 平台 实现 完整 的 模拟 运行 框架 。 通 常情 况 下 ,模拟 器 中 出 现 的 错误 都 很 细微 , 不易 复 
现 ， 难 以 查找 。 

近 些 年 ， 使 用 信号 来 暂停 线程 的 方式 受到 颇 多 争议 。 实 践 发 现 ， 在 某 些 操作 系统 上 ， 尤 以 

Linux 为 例 , 应 用 程序 对 信号 的 使 用 和 测试 很 不 到 位 , 还 有 一 些 第 三 方 的 本 地 库 不 遵守 信和 号 约定 ， 
导致 信号 冲突 等 事件 的 发 生 。 因 此 ， 与 信号 相关 的 外 部 依赖 已 经 不 再 可 靠 。 
新 版 本 的 JRockit 使 用 了 传统 的 安全 点 来 处 理应 用 程序 暂停 操作 。 这 种 方式 会 在 代码 中 插入 
用 于 解 引用 某 个 保护 页 ( guard page ) 的 安全 点 指令 ( safepoint instruction ), 这 些 指 令 指 针 中 都 包 
含 了 完整 的 存活 对 象 图 信息 。 将 要 暂停 Java 应 用 程序 线程 时 ， 运 行 时 系统 负责 保证 保护 页 是 不 
可 访问 的 ， 这 使 得 执行 安全 点 指令 时 会 触发 一 个 错误 处 理 。 就 目前 来 看 ， 所 有 的 商用 JVM 都 使 
用 了 这 种 方法 或 是 其 变种 。 循 环 结构 是 个 典型 例子 ,一 般 都 会 在 循环 头 中 搬入 安 全 点 指令 。 在 没 
有 解 引 用 保护 页 之 前 就 继续 执行 应 用 程序 是 绝 不 允许 发 生 的 , 因此 , 像 无 限 循环 这 样 的 结构 就 必 
须 使 用 安全 点 指令 。 

使 用 安全 点 的 缺陷 在 于 , 它 需 要 在 生成 的 代码 中 额外 插入 显 式 解 引用 保护 页 的 代码 ,因此 造 
成 一 点 性 能 消耗 ， 但 相对 于 它 的 优点 来 说 ， 这 点 牺牲 还 是 值得 的 。 

到 目前 为 止 , 我 们 介绍 了 垃圾 回收 的 基本 概念 和 算法 ,并 讲解 了 执行 垃圾 回收 时 所 面临 的 问 
题 ， 例 如 如 何 生成 根 集合 。 接 下 来 ,将 联系 实际 介绍 如 何 优化 垃圾 回收 ， 以 及 如 何 使 垃圾 回收 更 
具 伸 缩 性 。 
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3.3.4 “分 代 垃 圾 回收 


经 过 大 量 实际 观察 得 知 ， 在 面向 对 象 编程 语言 中 ， 大 多 数 对 象 的 生命 周期 都 非常 短 。 

理论 上 讲 ， 对 于 那些 临时 对 象 来 说 ， 编 译 阶段 的 逃逸 分 析 可 以 使 其 避免 在 堆 上 分 配 内 存 , 但 
在 现实 世界 中 ， 有 时 却 行 不 通 ， 尤 其 对 于 像 Java 这 样 的 语言 来 说 ， 编 译 阶段 的 逃逸 分 析 难 以 做 
得 非常 充分 。 

事实 上 ， 将 堆 划 分 为 两 个 或 多 个 称 为 代 ( generation ) 的 空间 ， 并 分 别 存 放 具 有 不 同 长 度 生 
命 周 期 的 对 象 ， 可 以 提升 垃圾 回收 的 执行 效率 。 在 JRockit H, IWEJE (young ) 的 对 象 存放 在 称 
为 新 生 代 (nursry ) 的 空间 中 ， 一般 来 说 ， 它 的 大 小 会 比 老年 代 ( old collections) 小 很 多 ， 随 着 
垃圾 回收 的 重复 执行 ， 生 命 周 期 较 长 的 对 象 会 被 提升 (promote ) 到 老年 代 中 。 因 此 ， 新 生 代 垃 
圾 回收 和 老年 代 垃圾 回收 两 种 不 同 的 垃圾 回收 方式 应 运 而 生 , 分 别 用 于 对 各 自 空间 中 的 对 和 象 执行 
垃圾 回收 。 

新 生 代 垃圾 回收 的 速度 比 老年 代 快 几 个 数量 级 , 即使 新 生 代 垃圾 回收 的 频率 更 高 ,执行 效率 
也 仍然 比 老年 代 垃 圾 回收 强 ， 这 是 因为 大 多 数 对 象 的 生命 周期 都 很 短 ， 根 本 无 须 提 升 到 老年 代 。 
理想 情况 下 ， 新 生 代 垃 圾 回收 可 以 大 大 提升 系统 的 否 吐 量 ， 并 消除 潜在 的 内 存 人 碎片 。 

1. 多 个 新 生 代 的 内 存 排 布 

一 般 情况 下 , 分 代 式 垃圾 回收 默认 只 使 用 一 个 新 生 代 ,， 而 在 某 些 情况 下 ,使 用 多 个 小 的 新 生 
代 来 分 级 存储 不 同年 龄 的 对 象 ( 即 从 多 少 次 垃圾 回收 中 存活 下 来 ) 会 更 有 效率 。 相 比 于 普通 的 一 
个 新 生 代 和 一 个 老年 代 的 分 布 , 多 个 新 生 代 的 分 布 将 对 和 象 移动 到 不 同 级 别 的 新 生 代 中 , 最 后 提升 
IZER, 减少 了 老年 代 中 对 象 的 数量 。 

当 需 要 分 配 大 对 象 时 ， 这 种 方法 尤其 有 用 。 

这 里 , 假设 大 部 分 对 象 的 生命 周期 都 很 短 。 如 果 它 们 的 存活 时 间 稍 长 一 点 , 例如 能 活 过 一 次 
垃圾 回收 ,那么 使 用 单一 新 生 代 时 ,这些 对 象 就 会 被 提升 到 老年 代 ， 当 他 们 在 某 个 时 刻 被 回收 掉 
时 ， 就 会 在 老年 代 中 产生 内 存 碎 片 。 相 比 之 下 ,使 用 多 个 新 生 代 来 存储 不 同年 龄 的 对 象 则 可 以 减 






























































少 这 种 现象 的 发 生 。 
当然 ,使 用 多 个 新 生 代 会 带 来 一 些 对 象 复制 的 开销 ,因此 在 设置 新 生 代 分 区 时 需要 做 好 权衡 。 
2. 写 屏障 


在 分 代 式 垃圾 回收 中 ,执行 垃圾 回收 时 ， 引 用 的 双方 可 能 不 在 同一 个 代 中 。 例如， 老年 代 中 
的 对 象 可 能 包含 有 指向 新 生 代 对 象 的 引用 ,或 者 有 反 向 的 引用 关系 。 因 此 ,如 果 在 执行 垃圾 回收 
时 将 所 有 这 样 的 引用 关系 都 更 新 一 遍 , 这 种 操作 带 来 的 性 能 损耗 就 完全 抵消 了 分 代 式 垃圾 回收 所 
带 来 的 性 能 提升 。 由 于 分 代 式 垃圾 回收 的 关键 点 就 是 将 堆 划 分 成 不 同 的 空间 , 并 分 别处 理 其 中 的 
对 象 ， 因 此 ， 需 要 代码 生成 器 提供 一 些 辅助 信息 来 帮助 完成 垃圾 回收 。 

在 实现 分 代 式 垃圾 回收 时 ， 大 部 分 JVM 都 是 用 名 为 写 屏障 (write barrier) 的 技术 来 记录 执 
行 垃圾 回收 时 需要 遍历 堆 的 哪些 部 分 。 当 对 象 A 指 向 对 象 日 时 ， 即 对 象 B 成 为 对 象 A 的 属性 的 
值 时， 就 会 触发 写 屏障 ， 在 完成 属性 域 赋值 后 执行 一 些 辅助 操作 。 

写 屏障 的 传统 实现 方式 是 将 堆 划 分 成 多 个 小 的 连续 空间 ( 例如 每 块 512 字 节 )， 每 块 空间 称 
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为 卡片 (card )， 于 是 ， 堆 被 映射 为 一 个 粗 粒度 的 卡 表 (card table )。 当 Java 应 用 程序 将 某 个 对 象 
赋值 给 对 象 引 用 时 ， 会 通过 写 屏 障 设置 脏 标志 位 (dirty bit )， 将 该 对 象 所 在 的 卡片 标记 为 脏 。 

这 样 ， 遍 历 从 老年 代 指 向 新 生 代 的 引用 时 间 得 以 缩短 ， 垃 圾 回收 需 在 做 新 生 代 垃圾 回收 时 ， 
只 需要 检查 老年 代 中 被 标记 为 脏 的 卡片 所 对 应 的 内 存 区 域 即 可 。 


根 集合 


= 


新 生 代 


上 图 是 运行 时 将 要 开始 执行 新 生 代 垃圾 回收 时 的 情况 。 如 果 此 时 根 集合 中 只 包含 对 象 A， 从 
图 中 的 引用 关系 可 知 ， 对 象 A 和 对 象 B 是 存活 的 。 这 里 会 忽略 掉 对 象 B 与 对 象 C 的 引用 关系 ， 
因为 对 象 C 位 于 老年 代 中 。 但 是 ， 执 行 垃圾 回收 时 ， 却 必须 要 将 位 于 老年 代 的 对 象 E 添加 到 根 
集合 中 ,因为 它 含 有 一 个 指向 新 生 代 对 象 的 引用 。 在 写 屏 障 的 作用 下 , 垃圾 回收 器 无 须 遍 历 整个 
老年 代 来 查找 对 象 E， 只 需要 检查 老年 代 中 那些 被 标记 为 脏 的 卡片 即 可 。 在 这 个 例子 中 ,通过 写 
屏障 将 对 象 E 中 的 引用 指向 对 象 F 后 ， 对 象 E 所 在 的 卡片 会 被 标记 为 脏 ， 因 此 ， 新 生 代 垃圾 回 
收 需 可 以 将 对 象 F 添加 到 可 跟踪 对 象 集合 中 。 
对 象 A 和 对 象 B 是 从 根 集 合 可 达 (reachable ) 的 , 存活 过 新 生 代 垃圾 回收 后 , 会 被 提升 到 老 
年 代 中 ; 而 对 象 G 和 对 象 H 无 法 从 根 集合 达到 ， 会 被 垃圾 回收 器 回收 掉 ;， 对 象 E 和 对 象 F 从 根 
集合 可 达 ， 因 此 对 象 F 在 新 生 代 垃圾 回收 后 会 被 提升 到 老年 代 。 尽 管 对 象 | 已 经 死亡 , 但 是 它 所 
占用 的 内 存 空间 只 能 等 到 下 次 老年 代 垃圾 回收 时 才 会 被 回收 掉 。 下 图 展示 了 经 过 新 生 代 垃 圾 回收 
和 对 象 提升 之 后 的 对 象 分 布 情况 , 由 于 执行 的 是 新 生 代 垃圾 回收 , 所 以 原本 在 老年 代 中 的 对 象 未 
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生 代 垃圾 回收 之 前 






































































































































受 影响 。 
新 生 代 垃圾 回收 之 后 
(A) 
(8) (©) 
O © 
新 生 代 
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3.3.5 Bite Sik 


回顾 一 下 第 2 章 的 内 容 , JVM 优化 的 主要 方向 是 缩短 总 体 运行 时 间 。 就 代码 生成 来 说 , 总 体 
运行 时 间 等 于 代码 编译 时 间 与 代码 执行 时 间 之 和 , 正如 前 面 介绍 的 , 针对 优化 其 中 一 方 可 能 会 延 
长 男 一 方 的 时 间 。 

就 内 存 管理 来 说 ,等 式 相 对 简单 一 点 。 为 了 降低 总 体 运行 时 间 , 缩短 垃圾 回收 所 花费 的 时 间 
似乎 是 唯一 合适 的 方案 。 

但 问题 在 于 垃圾 回收 是 STW 式 的 ， 会 在 某 个 时 间 点 暂停 所 有 应 用 程序 线程 ， 而 如 果 想 要 使 
垃圾 回收 线程 和 应 用 程序 并 发 运行 的 话 , 就 需要 记录 很 多 额外 的 信息 , 从 而 延长 垃圾 回收 的 时 间 。 
如 果 应 用 程序 重点 关注 否 吐 量 , 那么 STW 式 的 垃圾 回收 就 不 是 问题 了 , 直接 和 暂停 应 用 程序 线程 ， 
动用 所 有 的 CPU 全 力 执 行 垃圾 回收 即 可 。 但 实际 上 ， 对 于 大 多 数 应 用 程序 来 说 ， 低 延迟 是 很 重 
要 的 ， 而 导致 延迟 高 的 一 个 原因 就 是 CPU 将 部 分 时 间 放 在 了 非 应 用 程序 线程 上 。 

因此 , 在 内 存 管理 中 需要 权衡 的 就 是 最 大 化 吞吐 量 和 保持 低 延 迟 。 在 实际 场景 中 ,二 者 难以 
兼 得 。 

1. 优化 吞吐 量 

对 于 某 些 应 用 程序 来 说 ， 延 迟 大 小 根本 不 是 问题 ， 例 如 那些 需要 操作 大 量 对 象 的 离线 任务 。 
那些 需要 运行 整 晚 的 批 处 理 任务 不 像 C/S 架构 的 应 用 程序 那样 对 响应 时 间 有 什么 要 求 。 

如 果 应 用 程序 允许 暂停 时 间 长 达 数 秒 的 话 ， 那 么 就 可 以 尽 全 力 优化 以 达到 最 大 化 吞吐 量 的 
目标 。 

以 最 大 化 吞吐 量 为 目标 的 垃圾 回收 方法 有 很 多 种 , 最 简单 的 就 是 暂停 应 用 程序 线程 ,以 尽 可 
能 多 ( 线程 数 至 少 会 与 当前 平台 的 CPU 核 数 相同 ) 的 线程 并 行 执 行 垃圾 回收 ， 每 个 线程 负责 堆 
的 一 部 分 区 域 。 当 然 , 还 需要 在 不 同 的 垃圾 回收 线程 之 间 做 一 些 同步 处 理 , 以 避免 不 同 区 域 中 有 
引用 关系 存在 时 可 能 会 出 现 的 种 种 问题 。 在 JRockit 中 ， 这 种 方式 称 为 并 行 垃圾 回收 (parallel 
garbage collection )。 

其 实 , 在 保持 低 延 迟 的 水 平 下 , 仍 可 以 通过 对 并 行 垃 圾 回收 做 一 些 调整 来 满足 不 同等 级 的 知 
叶 量 要 求 ， 例 如 在 堆 中 使 用 分 代 式 管理 。 

2. 优化 延迟 

低 延 迟 优化 基本 的 重点 是 避免 STW 式 的 操作 ， 尽 可 能 让 应 用 程序 线程 多 工作 。 但 是 ， 如 果 
垃圾 回收 需 得 到 的 CPU 资源 过 少 ， 无 法 跟 上 内 存 分 配 的 速度 ， 则 堆 会 被 填 满 ，JVM 会 抛 出 
OutOfMemoryError 错误 。 因 此 ， 理 想 的 垃圾 回收 顺应 该 是 可 以 伴随 着 应 用 程序 运行 完成 大 部 
分 垃圾 回收 工作 的 。 

在 JRockit 中 ， 这 种 方式 称 为 并 发 垃圾 回收 (concurrent garbage collection ), Boehm 和 相关 研 
究 者 的 论文 中 首先 使 用 了 这 个 词 来 介绍 这 种 技术 。 后 来 ， 使 用 近 并 发 (mostly concurrent ) 来 指 
代 该 算法 的 改进 版 。 
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并 发 和 并 行 两 个 词 的 含义 容易 引起 误会 。 就 垃圾 回收 来 说 , 并 行 一 词 指 的 是 
垃圾 回收 线程 不 与 应 用 程序 线程 同时 运行 ,之 所 以 称 之 为 并 行 是 因为 在 执行 垃圾 
回收 时 会 使 用 尽 可 能 多 的 线程 同时 工作 。 而 垃圾 回收 线程 和 应 用 程序 线程 同时 工 
作 的 垃圾 回收 方式 称 为 并 发 垃圾 回收 。 

其 实 , 并 发 垃圾 回收 是 并 行 垃圾 回收 一 种 特例 , 因为 它 也 会 使 用 多 线程 同时 
执行 垃圾 回收 操作 。 并 发 与 并 行 这 两 个 词 并 非 专 指 JRockit 中 的 垃圾 回收 ， 在 学 
术 研 究 领域 和 商业 实现 中 已 成 为 标准 名 词 。 











标记 -清理 垃圾 回收 算法 中 的 很 多 步骤 都 可 以 以 并 发 的 方式 与 应 用 程序 线程 同时 进行 ， 


中 ， 标 记 是 最 重要 的 步 又， 执行 时 间 也 最 长 ， 大约 占 总 体 垃 圾 回收 时 间 的 90%。 幸 和 运 的 是 ， 标 











其 
示 


记 操 作 可 以 采用 并 行 实现 ， 而 且 其 中 很 大 一 部 分 工作 可 以 与 应 用 程序 线程 并 发 执行 。 尽 管 清理 
和 整理 操作 相对 麻烦 一 些 ,但 也 可 以 对 不 同 的 堆 区 域 分 别 执行 清理 和 整理 操作 来 提升 JVM 的 
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近 并 发 垃圾 回收 的 主体 思路 是 想 办 法 在 应 用 程序 线程 执行 的 时 候 , 尽 可 能 多 地 完成 垃圾 回收 


工作 。 整 个 垃圾 回收 周 


























期 仍然 包含 了 几 个 较 短 的 、 需 要 STW 操作 的 环节 ， 需 要 同步 修改 对 象 关 


系 图 , 因为 在 其 他 环节 中 , 应 用 程序 线程 仍 在 运行 , 可 能 会 修改 对 象 间 的 引用 关系 。 就 目前 来 看 ， 
在 所 有 JVM 的 商业 实现 版 本 中 ， 为 了 达到 低 延迟 的 目标 ， 都 是 用 了 类 似 的 算法 。 


3.5 节 将 




















会 对 JRockit 如 何 实现 高 性 能 和 低 延 迟 做 更 详细 的 介绍 。 


3.3.6 JRockit 中 的 垃圾 回收 
中 垃圾 回收 算法 的 基础 是 三 色 标 记 清 理 算 法 ， 其 中 加 入 了 一 些 改进 优化 以 提升 并 行 


JRockit 





























该 算法 做 了 大 量 的 调整 。 
根据 优化 目标 的 不 同 ，JRockit 中 的 垃圾 回收 可 以 分 代 执行 ， 也 可 以 不 分 代 执 行 。 本 章 后 续 
将 会 介绍 相关 的 垃圾 回收 策略 和 上 自 适 应 实现 。 


在 JRockit 中 ， 垃 圾 回收 器 可 以 选择 为 堆 中 的 对 象 打 一 个 长 期 或 短期 的 钉 住 
A (pinned ) 标签 。 该 标签 的 使 用 可 以 使 并 发 垃圾 回收 算法 更 具 灵 活性 ， 还 可 以 
提升 IJO 性 能 ， 例 如 在 整个 IO 操作 中 ， 始 终 保持 缓冲 区 在 同一 个 位 置 。 对 于 那 
些 需要 频繁 操作 内 容 的 应 用 程序 来 说 , 这 个 特性 可 以 大 幅 提 升 整体 性 能 。 其 实在 
垃圾 回收 算法 中 ， 钉 住 的 标签 是 个 相对 简单 的 概念 ， 但 只 有 少数 几 种 JVM 商业 
实现 ， 例 如 Rockit. 


1. 老年 代 垃圾 回收 
标记 清理 算法 是 JRockit 中 并 行 或 并 发 垃圾 回收 的 基础 ， 在 实际 实现 中 ， 使 用 的 是 双色 标记 








性 , 优化 了 垃圾 回收 的 线程 数 , 并 且 使 其 可 以 与 应 用 程序 线程 并 发 运行 。 而 在 新 生 代 垃 圾 回收 中 ， 
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算法 而 不 是 三 色 ， 虽 然 与 3.3.2 节 中 所 介绍 的 不 太一 样 ， 但 仍 保持 了 足够 的 并 行 性 。 在 JRockit 
中 , 使 用 灰色 标记 位 来 标记 堆 中 的 存活 对 象 ， 从 语义 上 讲 ， 这些 对 象 等 同 于 传统 三 色 标 记 算法 中 
灰色 对 象 和 黑色 对 象 的 合集 。 区 别 在 于 ，JRockit 中 的 存活 对 象 会 被 放 入 到 垃圾 回收 线程 的 线程 
局 部 队列 (thread local queue ) 中 。 这 样 做 有 两 个 好 处 ， 一 是 并 行 运行 的 垃圾 回收 线程 可 以 使 用 
各 自 的 线程 局 部 数据 ， 而 不 需要 同步 操作 公共 数据 ， 二 是 可 以 使 用 预 抓 取 (prefetch) 方式 ， 按 
照 先 人 先 出 的 顺序 来 访问 队列 中 的 元 素 , 这 样 可 以 提升 整体 的 执行 性 能 。 后 文 会 详细 介绍 使 用 预 
抓 取 的 优势 。 

此 外 , 在 JRockit 的 并 发 垃圾 回收 中 还 是 用 存活 标记 位 (live bit) 来 标记 系统 中 所 有 的 存活 
对 象 (包括 新 创建 的 对 象 )， 这 样 就 可 以 快速 找 出 应 用 程序 在 并 发 标记 阶段 新 创建 了 哪些 对 象 。 

JRockit 不 仅 将 卡 表 应 用 于 分 代 式 垃圾 回收 ， 还 用 在 并 发 标记 阶段 结束 时 的 清理 工作 ， 避 免 
搜索 整个 存活 对 象 图 。 这 是 因为 JRockit 需要 找 出 在 执行 并 发 标记 操作 时 ， 应 用 程序 又 创建 了 哪 
些 对 象 。 修 改 引 用 关系 时 通过 写 屏障 可 以 更 新 卡 表 , 存活 对 象 图 中 的 每 个 区 域 使 用 卡 表 中 的 一 个 
卡片 表示 , 卡片 的 状态 可 以 是 干净 或 者 脏 , 有 新 对 象 创建 或 者 对 象 引 用 关系 修改 了 的 卡片 会 被 标 
记 为 脏 。 在 并 发 标记 阶段 结束 时 , 垃圾 回收 器 只 需要 检查 那些 标记 为 脏 的 卡片 所 对 应 的 堆 中 区 域 
即 可 ， 这 样 就 可 以 找到 在 并 发 标记 期 间 新 创建 的 和 被 更 新 过 引用 关系 的 对 象 。 

2. 新 生 代 垃 圾 回收 

JRockit 在 新 生 代 中 使 用 了 暂停 -复制 算法 的 变种 ， 大 致 过 程 是 暂停 应 用 程序 线程 ， 复制 存 活 
对 象 到 堆 中 的 男 一 个 区 域 或 提升 到 老年 代 。 

复制 对 象 时 是 按照 引用 关系 层次 结构 , 以 广度 优先 的 方式 进行 的 , 这 样 可 以 增加 缓存 的 局 部 
性 ， 即 为 了 尽 可 能 高 效 地 利用 组 在， 互相 引用 的 对 象 在 存储 时 应 该 放 在 一 起 。 为 了 达到 较 好 的 执 
行 效 率 ， 可 以 采用 广度 优先 算法 的 并 行 实现 。 

垃圾 回收 周期 结束 后 ,存活 对 象 会 被 复制 到 老年 代 中 。 在 查找 年 轻 代 存活 对 象 时 ,并 不 需要 
搜索 整个 堆 ， 只 需要 借助 前 面 章 节 中 介绍 的 存活 标记 位 和 卡 表 , 查找 那些 存活 对 象 和 在 并 发 标记 
阶段 被 修改 的 内 存 区 域 即 可 。 最 开始 的 时 候 , 新 生 代 中 是 空 的 ， 而 所 有 的 对 象 在 更 新 引用 时 都 会 
通过 写 屏 障 将 对 应 的 卡片 设置 为 脏 , 所 以 查找 新 生 代 中 的 存活 对 象 时 ， 只 需要 扫描 标记 为 脏 的 卡 
片 ， 在 其 中 查找 含有 存活 标记 位 的 对 象 即 可 。 

在 JRockit 中 ， 新 生 代 垃圾 回收 是 以 并 行 方式 执行 的 ， 而 非 并 发 ， 但 出 于 执行 效率 方面 的 考 
虑 ,新 生 代 垃圾 回收 可 能 会 穿插 在 老年 代 并 发 垃圾 回收 期 间 执行 ,这 增加 了 程序 的 复杂 性 ， 当 老 
年 代 垃 圾 回收 和 新 生 代 垃圾 回收 需要 对 同一 数据 结构 操作 时 尤 甚 。 

但 事实 证 明 , 在 使 用 这 些 数据 结构 、 位 集合 和 卡 表 时 ， 只 要 老年 代 垃 圾 回收 时 可 以 知晓 哪些 
卡片 在 并 发 标记 阶段 被 标记 为 脏 即 可 , 因此 在 实现 中 使 用 了 一 个 额外 的 卡 表 来 记录 原始 卡 表 中 有 
哪些 卡片 被 标记 为 脏 。 在 JRockit 中 ， 这 些 改变 的 卡片 的 集合 称 为 修改 集 (modified union set ), 
只 要 修改 集中 的 卡片 在 执行 老年 代 垃 圾 回收 时 完整 无 缺 , 新 生 代 垃 圾 回收 就 可 以 放心 执行 并 清除 
卡片 的 脏 标记 。 因 此 ， 老 年 代 垃 圾 回收 和 新 生 代 垃圾 回收 可 以 同时 执行 而 不 会 互相 干扰 。 

在 JRockit 中 ， 还 有 一 个 保留 区 (keep area) 的 概念 ， 它 是 新 生 代 中 的 一 块 内 存 ， 用 于 存储 
那些 在 新 生 代 垃圾 回收 之 后 没有 被 复制 到 老年 代 的 对 象 。 通 过 将 新 创建 的 对 象 存储 于 保留 区 中 ， 
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使 新 创建 的 对 象 在 被 复制 到 老年 代 之 前 有 更 大 的 机 会 被 回收 掉 。 其 具体 实现 采用 了 与 多 代 式 垃圾 
回收 相似 的 内 存 划 分 ， 使 得 对 象 会 在 新 生 代 中 逗留 更 长 的 时 间 。 

3. 永生 代 垃 圾 回收 

JRockit 与 HotSpot 的 一 个 主要 区 别 就 是 没有 永生 代 ( permanent generation )。 在 HotSpot 中 ， 
一 部 分 内 存 被 用 作 永 生 代 , 用 于 存储 一 些 元 数据 ， 例 如 类 对 象 等 。 从 一 般 意义 上 讲 ， 处 于 永生 代 
中 的 对 象 不 会 被 回收 掉 〈 具体 情况 与 不 同 的 垃圾 回收 策略 有 关 )， 因 此 ， 如 果 应 用 程序 需要 载 人 
大 量 的 类 , 那么 永生 代 可 能 会 被 填 满 而 导致 JVM 抛 出 OutofMemoryError 错误 。 这 样 的 问题 曾 
经 在 一 些 客户 那里 出 现 过 ， 不 得 不 定期 重启 整个 Java 进程 。 

在 JRockit 中 ， 元 数据 信息 存储 在 堆 外 的 本 地 内 存 中 。 代 码 缓冲 区 中 存储 的 编译 过 的 方法 和 
已 经 无 用 的 类 加 载 器 所 引用 的 元 数据 信息 ， 会 持续 不 断 地 被 垃圾 回收 需 清 理 。 在 JRockit 中 ， 
元 数据 导致 的 outofMemoryError 错误 与 HotSpot 中 差别 不 大 ， 只 不 过 是 JRockit 使 用 本 地 内 
存 存 储 ，HotSpot 使 用 堆 内 存 存储 。 除 此 之 外 ,还 有 两 个 重要 区 别 。 一 是 在 JRockit 中 总 是 默认 启 
用 对 无 用 元 数据 的 清理 ,二 是 存储 元 数据 的 空间 没有 固定 大 小 限制 。 事实 上 ,也 很 难为 元 数据 区 
确定 一 个 准确 的 大 小 限制 。128 MB 够 不 够 ? AHS, HS 256 MB 呢 ? 对 于 目标 应 用 程序 来 说 ， 这 
个 数值 确实 难以 确定 。 因 此 在 这 方面 ，JRockit 采 用 了 动态 分 配 内 存 的 策略 ， 无 须 考 虑 大 小 限制 。 
当然 ,如果 任意 分 配 而 不 做 回收 的 话 ， 最 终 还 是 可 能 会 超过 本 地 内 存 大 小 的 限制 ,从 而 使 虚拟 机 
抛 出 错误 。 

4. 内 存 整理 

JRockit 是 以 单线 程 、 非 并 发 的 方式 执行 内 存 整 理 的 工作 ， 但 对 于 并 行 垃圾 回收 器 来 说 ， 内 
存 整 理 是 在 清理 阶段 进行 的 。 由 于 内 存 整 理 是 单线 程 运行 的 , 运行 速度 和 时 间 可 控 就 显得 非常 重 
BE, JRockit 在 每 次 执行 垃圾 回收 时 只 会 对 堆 的 某 一 部 分 做 内 存 整理 工作 ， 以 此 来 控制 内 存 整理 
的 运行 时 间 。 大 部 分 时 间 里 ,会 使 用 启发 式 算法 (heuristics algorithm ) 来 选择 到 底 对 哪 部 分 内 存 
做 整理 ， 以 及 整理 到 何 种 程度 ; 此 外 ， 还 会 用 于 确定 到 底 使 用 何 种 类 型 的 内 存 整 理 ， 即 是 选择 只 
会 在 堆 中 的 一 个 分 区 内 的 内 部 整理 (internal compaction )， 还 是 选择 会 在 堆 中 的 几 个 分 区 之 间 的 
外 部 整理 (external compaction )， 也 称 为 清理 (evacuation )。 

为 了 更 高 效 地 更 新 那些 指向 被 移动 了 的 对 象 的 引用 , 在 标记 阶段 , 如 果 堆 中 某 个 分 区 中 的 对 
象 将 来 会 被 整理 移动 位 置 的 话 ，JRockit 会 记录 下 所 有 指向 该 对 象 的 引用 。 这 部 分 信息 可 以 用 来 
判断 是 否 应 该 对 某 部 分 区 域 做 内 存 整 理 , 还 可 以 判断 是 否 因为 有 太 多 其 他 对 象 引 用 了 某 个 对 象 而 
不 宜 移动 它 的 位 置 。 


3.4 性 能 与 伸缩 性 
本 节 将 理论 联系 实际 ， 看 看 现代 运行 时 系统 是 如 何 提升 内 存 管理 的 执行 性 能 的 。 


3.4.1 线程 局 部 分 配 
在 JRockit 中， 使 用 了 名 为 线程 局 部 分 配 (thread local allocation ) 的 技术 来 大 幅 加 速 对 象 的 
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分 配 过 程 。 正 常情 况 下 , 在 线程 内 的 缓冲 区 中 为 对 象 分 配 内 存 要 比 直接 在 需要 同步 操作 的 堆 上 分 
配 内 存 快 得 多 。 垃圾 回收 器 在 推 上 直接 分 配 内 存 时 是 需要 对 整个 堆 加 锁 的 ,对 于 多 线程 竞争 激烈 
的 应 用 程序 来 说 ， 这 将 会 是 一 场 灾难 。 因 此 ， 如 果 每 个 Java 线程 能 够 有 一 块 局 部 对 象 缓冲 区 ， 
那么 绝 大 部 分 的 对 象 分 配 操作 只 需要 移动 一 下 指针 即 可 完成 , 在 大 多 数 硬 件 平台 上 , 只 需要 一 条 汇 
编 指 令 就 行 了 。 这 块 转 为 分 配对 象 而 保留 的 区 域 , 就 称 为 线程 局 部 缓冲 区 ( thread local area, TLA )。 
为 了 更 好 地 利用 缓存 ， 达 到 更 高 的 性 能 ， 一 般 情 况 下 ，TLA 的 大 小 介 于 16KB 到 128KB 之 
间 ， 当 然 ， 也 可 以 通过 命令 行 参数 显 式 指定 。 当 TLA 被 填 满 时 ， 垃 圾 回收 器 会 将 TLA 中 的 内 容 
提升 到 堆 中 。 因 此 ， 可 以 将 TLA 看 作 是 线程 中 的 新 生 代 内 存 空间 。 
当 Java 源 代码 中 有 new REI, FH. JIT 编译 器 对 内 存 分 配 执行 高 级 优化 之 后 ， 内 存 分 配 
的 伪 代 码 如 下 所 示 。 
Object allocateNewObject (Class objectClass) { 
Thread current = getCurrentThread(); 
int objectSize = alignedSize(objectClass) ; 
if (current.nextTLAOffset + objectSize > TLA_SIZE) { 
current .promoteTLAToHeap(); // 慢 ， 而 且 是 同步 操作 
current.nextTLAOffset = 0; 
} 


Object ptr = current.TLAStart + current.nextTLAOffset; 
current .nextTLAOffset += objectSize; 




























































































return ptr; 


} 
为 了 说 明 内 存 分 配 问题 ,在 上 面 的 伪 代 码 中 省 略 了 很 多 其 他 关联 操作 。 例 如 ， 
如 果 待 分 配 的 对 象 非常 大 ， 超 过 了 某 个 国 值 ， 或 对 象 太 大 导致 无 法 存放 在 TLA 
中 ， 则 会 直接 在 堆 中 为 对 象 分 配 内 存 。JRockit R28 引入 了 TLA 浪费 限额 (TLA 
waste limit) 来 衡量 TLA 的 使 用 情况 ， 详 细 情 况 参 见 第 5 章 。 


在 某 些 包含 大 量 寄 存 器 的 架构 中 , 为 了 达到 更 高 的 性 能 ,会 将 nextTLAOffset WHE, E2 
是 指向 TLA 的 指针 的 值 始终 保存 在 当前 线程 的 寄存 器 中 ， 而 对 于 像 x86 这 种 寄存 器 数量 不 多 的 
架构 来 说 ， 这 样 做 的 成 本 无 法 接受 。 


3.4.2 更 大 的 堆 内 存 


垃圾 回收 的 复杂 度 通常 与 存活 对 象 集合 的 大 小 相关 , 与 堆 的 大 小 没什么 关系 。 因 此 , 在 存活 
对 象 集合 不 变 的 情况 下 , 可 以 让 垃圾 回收 嚣 使 用 更 大 的 堆 内 存 , 这 样 做 能 够 减缓 内 存 碎片 化 的 趋 
势 ， 并 且 能 够 存储 更 多 的 存活 对 象 。 

1. 32 位 架构 下 的 4 GB 内 存 限制 

在 32 位 系统 中 ， 内 存 的 最 大 寻 址 范围 是 4GB。4 GB 是 理论 上 堆 内 存 的 最 大 值 。 但 实际 上 ， 
还 有 一 些 其 他 东西 会 占用 内 存 , 例如 操作 系统 自身 。 某 些 操作 系统 ,对 于 内 核 和 程序 库 在 内 存 中 
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的 排 布 有 非常 严格 的 要 求 ， 以 Windows 为 例 ， 它 要 求 内 核 要 位 于 内 存 地 址 空间 的 中 段 ， 这 样 就 
没 办 法 将 剩余 可 用 内 存 作 为 一 个 完整 的 连续 空间 使 用 。 大 部 分 JVM 只 能 将 连续 内 存 空间 作为 堆 
使 用 ， 因 此 大 大 限制 了 堆 的 大 小 。 

就 目前 所 知 ，JRockit 是 目前 唯一 支持 以 非 连续 内 存 空间 作为 堆 使 用 的 JVM， 因 此 可 以 充分 
利用 内 存 空 间 中 被 内 核 和 其 他 程序 库 分 隔 开 的 内 存 。 
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在 上 图 中 , 操作 系统 内 核 位 于 内 存 地 址 空间 的 中 段 , 限制 了 进程 的 最 大 虚拟 地 址 空间 。 内 存 
区 域 A 和 B 分 别 位 于 操作 系统 所 处 区 域 的 两 边 ，A 比 B 的 空间 稍 大 一 些 ， 因 此 ， 对 于 那些 只 能 
使 用 连续 空间 作为 堆 的 虚拟 机 来 说 ,内 存 区 域 A 就 是 堆 的 最 大 容量 ,而 通过 记录 一 些 额外 的 信息 ， 
支持 使 用 非 连 续 堆 空 间 的 虚拟 机 就 可 以 将 区 域 A 和 B 合并 为 一 个 整体 使 用 ， 虽然 会 带 来 一 些 额 
外 的 开销 , 但 提升 可 用 堆 空 间 的 容量 。 当 然 ， 这 种 实现 的 前 提 假 设 是 内 核 区 域 在 程序 运行 时 不 会 
发 生变 动 。 

随 着 64 位 架构 的 出 现 , 32 位 架构 的 使 用 正 逐 步 减 少 , 但 还 是 有 一 些 场景 在 大 量 使 用 32 位 架 
构 。 例 如 目前 的 虚拟 化 运行 环境 ， 在 有 限 的 内 存 中 ， 针 对 32 位 平台 做 大 量 的 性 能 优化 还 是 很 有 
意义 的 。 

2. 64 位 架构 

在 64 位 系统 中 ， 由 于 有 了 更 大 的 虚拟 地 址 空间 可 用 ( 即使 是 运行 32 位 JVM )， 开 发 人 员 无 
须 再 耗费 精力 去 思考 内 存 空间 被 非 应 用 程序 的 内 容 占 用 的 问题 了 。 

大 部 分 现代 人 处理 器 已 经 是 64 位 架构 了 , 内 存 寻 址 范围 理论 上 达到 了 16 EB, 这 是 非常 惊人 的 ， 
目前 来 看 ， 因 成 本 太 高 ， 还 没有 装备 如 此 巨大 内 存 的 机 融 出 现 。 

对 于 自动 内 存 管理 来 说 ，64 位 架构 是 把 双 刃 剑 ， 有 利 有 商 。 相 比 之 下 ， 代 码 生 成 则 从 64 位 
架构 中 获 利 ， 例 如 更 多 的 寄存 器 ， 位 宽 更 大 的 寄存 器 和 更 大 的 数据 带宽 。 

在 64 位 机 器 上 , 指针 的 长 度 不 再 是 4 字 节 , 而 是 8 字 节 , 这 需要 消耗 更 多 的 CPU 缓存 空间 。 
简单 来 说 就 是 ， 解 引用 一 个 32 位 指针 的 速度 会 比 解 引用 64 位 指针 快 ， 所 以 ， 对 于 操作 同样 大 小 
的 堆 来 说 ，64 位 版 本 程序 的 运行 速度 会 慢 很 多 。 

o 压缩 指针 
针对 前 面 提 到 的 问题 ， 一 个 折 中 的 解决 方案 是 压缩 指针 (compressed reference ), JRockit 首 
先 实现 了 这 个 优化 策略 。 如 果 JVM 运行 在 64 位 系统 上 ， 配 置 的 堆 小 于 4 GB， 这 时 候 再 使 用 64 
位 指针 表示 对 象 地 址 实在 没什么 意义 ，32 位 指针 已 经 够 用 ， 而 且 还 可 以 加 快 对 象 的 访问 速度 。 

64 位 系统 中 ， 堆 外 的 本 地 指针 是 系统 运行 时 的 一 部 分 ， 仍然 是 64 位 的 ， 例 如 JNI 中 用 于 引 
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用 Java 对 象 的 句柄 。 在 代码 中 可 能 需要 通过 JNI 转 换 , 将 压缩 过 的 指针 地 址 转换 为 普通 的 、 系 统 
长 度 的 地 址 ， 或 是 做 反 向 转换 。 例 如 垃圾 回收 器 和 本 地 代码 可 能 会 在 内 部 使 用 本 地 指针 ， 需 要 有 
相应 的 方法 将 压缩 的 指针 转换 普通 的 系统 指针 ,以 及 反问 转换 的 方法 。 这 个 转换 过 程 就 称 为 指针 
压缩 (reference compression ) 和 指针 解压 缩 ( reference decompression )。 

下 面 是 64 位 平台 上 压缩 和 解压 缩 指针 的 伪 代 码 ， 其 中 堆 的 基地 址 可 能 会 在 内 存 空间 的 任何 
ME: 



























































CompRef compress (Ref ref) { 
return (uint32_t)ref; //A IR 32 位 引用 地 址 
} 


Ref decompress(CompRef ref) { 
return globalHeapBase | ref; 


} 

压缩 过 的 指针 是 32 位 的 ， 通 过 与 堆 的 基地 址 做 or 运算 可 以 得 出 64 位 的 系统 指针 。 这 种 操 
作 的 好 处 是 解压 缩 操 作 不 会 改变 指针 的 值 , 可 以 执行 任意 次 数 。 但 是 ,根据 压缩 指针 中 二 进 制 位 
数 的 不 同 , 这 种 表示 方式 并 不 总 是 有 效 ， 且 必须 严格 维持 状态 机 ， 以 便 运 行 时 系统 能 够 知晓 什么 
时 候 该 压缩 指针 ,什么 时 候 需 要 解压 缩 指针 ,例如 从 存根 代码 跳 转 本 地 代码 , 或 从 本 地 代码 跳 转 
到 存根 代码 ， 又 或 者 是 代码 中 解 引 用 一 个 指向 对 象 的 64 位 句柄 。 

其 实 ， 压 缩 指针 并 不 仅仅 可 以 用 于 处 理 4 GB 堆 的 限制 问题 ,还 有 其 他 用 途 。 例 如 ， 现 在 堆 
的 大 小 是 64 GB， 在 表示 对 象 指针 长 度 时 ， 不 需要 使 用 64 位 ， 只 用 4 + 32 位 就 可 以 了 ,具体 
方法 是 将 64 GB 的 堆 划分 为 16 个 4 GB 的 分 区 ， 然 后 用 4 位 标明 对 象 处 于 哪个 分 区 中 ， 再 用 32 
位 标明 对 象 的 偏 移 地 址 。 这 种 方式 需要 额外 使 用 4 位 来 标记 对 象 的 分 区 位 置 ， 导 致 对 象 的 地 址 只 
能 按 16 字 节 对 齐 ， 这 会 浪费 一 些 堆 空间 ， 但 在 执行 性 能 上 会 有 所 提升 。 

CompRef compress(Ref ref) { 


return (uint32_t) (ref >> log,(objectAlignment) ) ; 


} 


















































Ref decompress(CompRef ref) { 
return globalHeapBase | (ref << log,(objectAlignment) ) ; 


} 


其 实 ， 如 果 对 象 是 以 16 字 节 对 齐 的 ， 并 且 地 址 空间 从 0 开始， 到 64 GB 结束 的 话 ， 那 么 在 
具体 实现 指针 压缩 的 时 候 还 有 更 简单 的 方法 。 例 如 ,解压 缩 指 针 时 将 指针 的 值 左 移 4 位 即 可 , 相 
对 地 ， 压 缩 指针 时 右 移 4 位 即 可 ， 无 须 使 用 堆 的 基地 址 参与 计算 。 普 通 场 景 下 ，JRockit 采用 的 
就 是 这 种 实现 方式 来 维护 压缩 过 的 、 长 度 为 32 位 的 指针 。 为 了 便于 实现 ，JRcokit 以 地 址 0 作为 
空 指 针 的 值 ， 因 此 ， 堆 中 起 始 的 4GB〈 即 低地 址 方向 的 4GB ) 将 无 法 使 用 ， 可 用 的 堆 空间 实际 
上 是 60GB, 虽然 有 些 浪费 , 但 相对 于 获得 的 性 能 提升 , 这 不 算 什 么 。 但 如 果 对 于 应 用 程序 来 说 ， 
这 4 GB 是 不 可 或 缺 的话 ， 那 么 就 需要 考虑 使 用 其 他 方法 了 。 

上 述 的 实现 方式 适用 于 那些 堆 大 于 或 等 于 4 GB 的 场景 ， 但 这 种 方式 有 一 个 缺点 ， 压 缩 或 解 
压缩 的 使 用 顺序 和 使 用 次 数 不 再 像 以 前 一 样 不 受 限 制 了 。 
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当然 ，64 GB 并 不 是 理论 上 的 限制 值 ， 只 是 举例 而 已 ， 因 为 已 经 有 基准 测试 和 应 用 程序 实例 
证 明了 , 对 于 64 GB 大 小 的 堆 来 说 ,启用 指针 压缩 会 获得 更 高 的 性 能 。 但 其 实 真 正 重要 的 是 , 启 
用 压缩 指针 会 浪费 多 少 位 ， 以 及 在 此 代价 下 ， 到 底 能 获得 多 少 性 能 方面 的 提升 。 在 某 些 案例 中 ， 
使 用 未 经 压缩 的 指针 效果 更 好 。 








在 JRockit R28 中 ， 不 同 配置 下 ， 理 论 上 ， 压 缩 指针 可 以 支持 最 大 64 GB 的 
堆 ， 部 分 压缩 指针 框架 可 以 自 适应 处 理 。 
如 果 启 动 JVM 时 没有 指定 堆 的 大 小 ， 或 者 指定 的 堆 小 于 或 等 于 64 GB, M 
会 默认 启用 指针 压缩 的 某 个 变种 。 对 象 对 齐 的 字 节 数 取决 于 堆 的 大 小 。 当 然 ， 也 
可 以 通过 命令 行 参数 显 式 地 禁用 指针 压缩 。 


就 JRockit 来 说 ， 压 缩 指针 之 后 的 主要 努力 方向 是 最 大 化 可 用 堆 内 存 的 大 小 和 可 存放 在 L1 
缓存 中 的 对 象 数 量 。 为 了 避免 在 菏 些 特殊 场景 下 可 能 出 现 问 题 ，JRockit 不 会 压缩 局 部 栈 帧 中 的 
指针 ,一 般 来 说 ,代码 生成 器 会 在 载 人 对 象 域 后 搬入 解压 缩 指 针 的 代码 , 在 存储 对 象 域 之 前 插 人 
压缩 指针 的 代码 。 尽 管 这 么 做 会 有 一 些 性 能 损耗 ， 但 非常 小 ， 几 乎 可 以 忽略 不 计 。 


3.4.3 缓存 友好 性 


除了 内 存 使 用 外 ， 垃 瓜 回 收 器 还 有 其 他 很 多 方面 要 照顾 到 ， 其 中 最 重要 的 就 是 缓存 友好 性 。 
因为 当 出 现 缓存 大 量 丢失 的 情况 时 ， 应 用 程序 的 性 能 会 大 幅 下 降 。 





























CPU 中 含有 指令 缓存 和 数据 缓存 (还 有 其 他 一 些 专用 缓存 )， 本 节 将 着 重 介 
绍 数据 缓存 的 问题 。 缓 存 中 包含 有 多 个 缓存 行 (cache-line )， 缓 存 行 是 CPU 可 访 
问 的 最 小 缓存 单元 。 当 CPU 从 内 存 中 获取 数据 后 ， 会 将 数据 放 入 到 缓存 行 中 ， 
以 便 将 来 使 用 时 可 以 更 快 获取 ， 这 样 会 比 从 内 存 中 再 读 取 一 次 快 上 几 个 数量 级 。 
CPU 的 缓存 结构 通常 具有 几 个 层级 , 第 一 级 速度 最 快 , 容量 最 小 , 距离 CPU 
Va 最 近 。 在 现代 处 理 器 架构 中 , 每 个 CPU 核心 都 有 自己 的 L1 缓 存 ,更 高 层级 的 缓 
> 存 就 未 必 是 核心 独 有 的 了 ， 有 可 能 会 被 所 有 的 核心 共享 。L1 缓存 的 容量 通常 是 
KB 级 ,L2 缓存 的 容量 是 MB 级 ,访问 1L2 缓存 会 比 访问 工 ] 缓存 耗费 更 多 的 时 间 ， 
但 仍然 会 比 直接 访问 内 存 快 得 多 。 
如 果 能 够 在 CPU 使 用 数据 之 前 ， 预 先 将 需要 的 数据 从 内 存 抓 取 到 缓存 中 ， 
就 能 够 减少 缓存 丢失 的 情况 , 但 如 果 抓 取 到 的 是 无 用 数据 , 就 会 非常 影响 执行 性 
能 。 因 此 , 自 适应 运行 时 系统 在 收集 了 必要 的 信息 后 , 能 够 很 好 地 完成 这 项 工作 。 








在 代码 生成 阶段 ， 收 集运 行 时 的 返回 信息 可 以 判断 出 在 访问 哪些 Java 对 象 时 会 导致 缓存 丢 
失 ， 以 此 来 修正 预 抓 取 的 准确 性 。 在 内 存 管 理 系 统 中 , 需要 关注 的 主要 问题 包括 对 象 存放 、 对 齐 
和 内 存 分 配 策 略 。 











1. 预 抓 取 

使 用 预 抓 取 策略 把 即将 使 用 到 的 数据 预先 载 人 到 缓存 中 , 这 样 ， 当 真正 需要 用 到 这 些 数据 的 
时 候 ， 就 可 以 直接 从 缓存 中 获取 ,效率 大 大 提高 ， 不 会 再 出 现 缓存 丢失 的 问题 ， 而 且 预 抓 取 的 操 
作 可 以 在 CPU 做 其 他 工作 时 并 行 完成 。 








通过 代码 显 式 地 完成 预 抓 取 工 作 称 为 软件 预 抓 取 ( software prefetching )。 需 

要 注意 的 是 ， 现 代 硬 件 架 构 中 一 般 内 建 有 更 高 级 的 硬件 预 抓 取 ( hardware 

> prefetching )， 如 果 内 存 访 问 具 有 符合 某 种 模式 或 者 满足 较 高 的 可 预测 性 ， 硬 件 
自身 可 以 很 好 地 完成 自动 预 抓 取 工作 。 


在 JRockit 中 , 垃圾 回收 器 的 实现 也 使 用 了 预 抓 取 技术 。 在 使 用 TLA 分 配 内 存 时 ,TLA 实际 
上 是 被 划分 成 很 多 小 内 存 块 的 ， 当 使 用 某 个 内 存 块 时 , 会 预 抓 取 与 其 相 邻 的 内 存 块 ， 这 样 当 使 用 
相 邻 内 存 块 时 就 可 以 快速 获取 到 所 需 数据 。 

如 果 能 够 准确 地 预 抓 取 到 即将 使 用 的 数据 ， 就 可 以 使 缓存 命中 ， 极 大 提升 整体 的 执行 效率 。 

这 种 实现 方式 的 缺点 在 于 , 每 次 将 数据 载 人 到 缓存 时 , 原先 缓存 中 存储 的 数据 就 全 被 废弃 了 ， 
太 过 频繁 地 预 抓 取 会 抵消 缓存 原 有 的 功能 。 此 外 ,， 预 抓 取 会 读 取 数 据 填 满 缓存 行 ， 这 需要 花费 一 
定 的 时 间 ， 因 此 ， 除 非 预 抓 取 能 够 以 流水 线 (pipeline ) 方式 执行 ， 或 者 能 够 与 其 他 操作 并 行 ， 
否则 预 抓 取 操作 可 能 并 不 会 带 来 性 能 提升 ， 有 时 候 甚 至 会 降低 执行 性 能 。 

2. 数据 存放 

如 果 能 够 预知 在 某 段 时 间 内 , 访问 数据 是 按 顺 序 或 近似 按 顺 序 的 , 那么 预先 将 可 能 会 访问 到 
的 数据 放 到 同一 个 缓存 行 中 , 根据 局 部 性 原理 , 可 以 获得 更 好 的 性 能 ,例如 , java.lang.String 
类 中 使 用 字符 数组 来 存储 字符 串 的 内 容 , 使 用 的 时 候 几 乎 都 是 按 顺序 访问 的 , 这 种 情况 就 很 适合 
提前 将 可 能 会 使 用 到 的 数据 预先 抓 取 到 缓存 行 中 。 随 着 应 用 程序 的 运行 , 内 存 管理 系统 获得 更 多 
的 运行 时 反馈 信息 ， 预 抓 取 数据 的 准确 性 也 会 越 来 越 高 。 

除了 通过 运行 时 反馈 信息 外 , 还 可 以 通过 获取 其 他 静态 信息 来 预测 可 能 会 使 用 到 的 数据 , 例 
如 可 以 预先 抓 取 某 个 对 象 引用 到 的 其 他 对 象 ， 或 者 某 个 数组 对 象 中 所 包含 的 元 素 。 






















































































3.4.4 NUMA 架构 


NUMA (non-uniform memory access， 非 统一 内 存 访 问 模型 ) 架构 的 出 现 为 垃圾 回收 带 来 了 
更 多 挑战 。 在 NUMA 架构 下 ， 不同 的 处 理 器 核心 通常 访问 各 自 的 内 存 地 址 空间 ， 这 是 为 了 避免 
因 多 个 CPU 核心 访问 同一 内 存 地 址 造成 的 总 线 延 迟 。 每 个 CPU 核心 都 配 有 专用 的 内 存 和 总 线 ， 
因此 CPU 核心 在 访问 其 专 有 内 存 时 速度 很 快 ， 而 要 访问 相 邻 CPU 核心 的 内 存 时 就 会 相对 慢 一 
HE, CPU 核心 相距 越 远 , 访问 速度 越 慢 ( 也 依赖 于 具体 配置 )。 传统 上 ， 多核 CPU 是 按照 UMA 
( uniform memory access， 统 一 内 存 访问 模型 ) 架构 运行 的 ， 所 有 的 CPU 核心 按照 统一 的 模式 ， 
无 差别 地 访问 所 有 内 存 。 

目前 ， 高 端 服务 器 所 使 用 的 两 种 NUMA 架构 分 别 是 AMD Opteron 系列 和 Intel Nehalem 系列 。 
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下 图 展示 了 NUMA 架构 下 CPU 核心 的 配置 示例 。 
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内 存 组 3 内 存 组 4 























上 图 中 , CPU 核心 , 或 称 NUMA 节点 , 与 访问 其 他 NUMA 节点 的 内 存 最 多 需要 两 步 才 能 完 
成 操作 ， 理 想 情况 下 ， 能 够 直接 访问 到 自己 独 有 的 内 存 则 不 需要 中 转 。 但 事实 上 ， 这 只 是 CPU 
核心 一 对 一 映射 的 情况 ,在 某 些 配 置 中 , 一 个 NUMA 节点 可 能 会 包含 多 个 CPU 核心 ,共享 一 块 
专属 本 地 内 存 。 

所 以 ,为 了 更 好 地 利用 NUMA 架构 ， 垃 圾 回收 需 线 程 的 组 织 结构 应 该 做 相应 的 调整 。 如 果 
某 个 CPU 核心 正在 运行 标记 线程 ， 那 么 该 线程 所 要 访问 的 那 部 分 堆 内 存 最 好 能 够 放置 在 该 CPU 
的 专 有 内 存 中 ， 这 样 才 能 发 挥 NUMA 架构 的 最 大 威力 。 在 最 坏 情况 下 ， 如 果 标 记 线 程 所 要 访问 
的 对 象 位 于 其 他 NUMA 节点 的 专 有 内 存 中 , 这 时 垃圾 回收 需 通 常 需要 一 个 启发 式 对 象 移动 算法 。 
这 是 为 了 保证 使 用 时 间 上 相近 的 对 象 在 存储 位 置 上 也 能 相近 , 如 果 这 个 算法 能 够 正确 工作 , 还 是 
可 以 带 来 不 小 的 性 能 提升 的 。 这 里 所 面临 的 主要 问题 是 如 何 避 免 对 象 在 不 同 NUMA 节点 的 专 有 
内 存 中 重复 移动 。 理 论 上 ， 自 适应 运行 时 系统 应 该 可 以 很 好 地 处 理 这 个 问题 。 

这 可 以 算 作 自 适应 运行 时 优化 的 又 一 个 示例 ,在 静态 环境 中 想 这 么 做 就 比较 难 了 。 第 5 童 会 
详细 介绍 可 用 于 指定 JVM 内 存 分 配方 式 和 修改 NUMA 架构 下 节点 亲 和 性 的 命令 行 参数 。 
















































































NUMA 架构 对 于 内 存 管理 是 一 大 挑战 。 然 而 对 JRockit 的 研究 表明 ， 即 便 不 
SN 针对 NUMA 架构 做 定制 优化 ， 如 果 能 很 好 地 完成 预 抓 取 并 充分 利用 缓存 的 话 ， 
同样 可 以 使 应 用 程序 达到 很 好 的 性 能 。 


345 大 内 存 页 


内 存 分 配 是 通过 操作 系统 及 其 所 使 用 的 页 表 完 成 的 。 操 作 系统 将 物理 内 存 划 分 成 多 个 页 来 
理 ， 从 操作 系统 层面 讲 ， 页 是 实际 分 配 内 存 的 最 小 单位 。 传 统 上 ， 页 的 大 小 是 以 4 KB 为 基本 单 
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位 划分 的 ， 页 操作 对 进程 来 说 是 透明 的 ， 进 程 所 使 用 的 是 虚拟 地 址 空间 ， 并 非 真 正 的 物理 地 址 。 
为 了 便于 将 虚拟 页 面 转换 为 实际 的 物理 内 存 地 址 , 可 使 用 名 为 旁 路 转换 缓冲 ( translation lookaside 
buffer, TLB ) 的 缓存 来 加 速 地 址 的 转换 操作 。 从 实现 上 看 ， 如 果 页 面 的 容量 非常 小 的 话 ， 会 导 
致 频繁 出 现 旁 路 转换 缓冲 丢失 的 情况 。 

修复 这 个 问题 的 一 种 方法 就 是 将 页 面 的 容量 调 大 几 个 数量 级 , 例如 以 MB 为 基本 单位 。 现 代 
操作 系统 普遍 倾向 于 支持 这 种 大 内 存 页 机 制 。 

很 明显 ， 当 多 个 进程 分 别 在 各 自 的 寻 址 空间 中 分 配 内 存 ， 而 页 面 的 容量 又 比较 大 时 ， 随 着 使 
用 的 页 面 数 量 越 来 越 多 , 碎片 化 的 问题 就 愈 发 严重 , 像 进程 要 分 配 的 内 存 比 页 面容 量 稍微 大 一 点 
的 情况 ， 就 会 浪费 很 多 存储 空间 。 对 于 在 进程 内 自己 管理 内 存 分 配 回收 、 并 有 大 量 内 存 空间 可 用 
的 运行 时 来 说 ， 这 不 算 什么 问题 ， 因 为 运行 时 可 以 通过 抽象 出 不 同 大 小 的 虚拟 页 面 来 解决 。 



























































通常 情况 下 ,对 于 那些 内 存 分 配 和 回收 频繁 的 应 用 程序 来 说 ,使 用 大 内 存 页 ， 
可 以 使 系统 的 整体 性 能 至 少 提升 10%。JRockit 对 大 内 存 页 有 很 好 的 支持 。 


在 大 多 数 操作 系统 中 ， 启 用 大 内 存 页 需要 较 高 的 管理 权限 。 


3.4.6 自 适 应 


正如 第 2 章 介绍 的 ， 对 于 像 Java 这 样 的 可 移植 性 很 好 的 编程 语言 来 说 ， 自 适应 是 其 成 功 的 
关键 。 传 统 上 ， 自 适应 只 应 用 于 代码 的 自 适应 重 优 化 和 针对 热 代 码 的 分 析 上 ， 但 JRockit 的 设计 
者 从 设计 之 初 就 尽 其 所 能 将 自 适应 的 应 用 范围 扩展 到 JRockit 的 各 个 功能 模块 。 

因此 ，JRockit 可 以 在 应 用 程序 运行 过 程 中 ， 基 于 内 存 管理 系统 的 反馈 信息 来 调整 垃圾 回收 
的 具体 行为 和 相关 参数 ， 例 如 堆 的 大 小 、 代 的 划分 ， 其 至 调整 垃圾 回收 的 整体 策略 。 

下 面 是 在 运行 JRockit 时 使 用 命令 行 参数 -xverbose:gc 打印 出 的 内 存 使 用 情况 。 

marcusl@nyarlathotep:$ java -Xmx1024M -Xms1024M -Xverbose:gc 

-cp dist/bmbm.jar com.oracle.jrpg.bmbm.minisjas.server.Server 

[memory] Running with 32 bit heap and compressed references. 

[memory] GC mode: Garbage collection optimized for throughput, 

initial strategy: Generational Parallel Mark & Sweep. 


[memory] Heap size: 1048576KB, maximal heap size: 1048576KB, 
nursery size: 524288KB. 

































































[memory] <s>-<end>: GC <before>KB-><after>KB (<heap>KB), <pause>ms. 
[memory] <s/start> - start time of collection (seconds since jvm start). 


[memory] <end> - end time of collection (seconds since jvm start). 
[memory] <before> - memory used by objects before collection (KB). 
[memory] <after> - memory used by objects after collection (KB). 
[memory] <heap> - size of heap after collection (KB). 

[memory] <pause> - total sum of pauses 


during collection (milliseconds). 
[memory] run with -Xverbose:gcpause to see 
individual pauses. 
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[memory] [YC#1] 28.298-28.431: YC 831035KB->449198KB 
(1048576KB), 132.7 ms 

[memory] [OC#1] 32.142-32.182: OC 978105KB->83709KB 
(1048576KB), 40.9 ms 

[memory] [OC#2] Changing GC strategy to Parallel Mark & Sweep 

[memory] [OC#2] 39.103-39.177: OC 1044486KB->146959KB 
(1048576KB), 73.0 ms 

[memory] [OC#3] Changing GC strategy to Generational 
Parallel Mark & Sweep 

[memory] [OC#3] 45.433-45.495: OC 1048576KB->146996KB 
(1048576KB), 61.8 ms 

[memory] [YC#2] 50.547-50.671: YC 968200KB->644988KB 
(1048576KB), 124.4 ms 

[memory] [OC#4] 51.504-51.524: OC 785815KB->21012KB 
(1048576KB), 20.2 ms 

[memory] [YC#3] 56.230-56.338: YC 741361KB->413781KB 
(1048576KB), 108.2 ms 

[memory] [YC#8] 87.853-87.972: YC 867172KB->505900KB 
(1048576KB), 119.4 ms 

[memory] [OC#9] 90.206-90.234: OC 875693KB->67591KB 
(1048576KB), 27.4 ms 

[memory] [YC#9] 95.532-95.665: YC 954972KB->591713KB 
(1048576KB), 133.2 ms 

[memory] [OC#10] 96.740-96.757: OC 746168KB->29846KB 
(1048576KB), 17.8 ms 

[memory] [YC#10] 101.498-101.617: YC 823790KB->466860KB 
(1048576KB), 118.8 ms 

[memory] [OC#11] 104.832-104.866: OC 1000505KB->94669KB 
(1048576KB), 34.5 ms 

[memory] [OC#12] Changing GC strategy to Parallel Mark & Sweep 

[memory] [OC#12] 110.680-110.742: OC 1027768KB->151658KB 
(1048576KB), 61.9 ms 

[memory] [OC#13] Changing GC strategy to Generational 
Parallel Mark & Sweep 

[memory] [OC#13] 116.236-116.296: OC 1048576KB->163430KB 
(1048576KB), 59.1 ms. 

[memory] [YC#11] 121.084-121.205: YC 944063KB->623389KB 
(1048576KB), 120.1 ms 


从 R28 RAR, Rockit 已 经 不 倾向 于 在 运行 时 修改 垃圾 回收 策略 了 ， 而 是 根 
据 具体 配置 选择 相关 策略 和 参数 。 对 于 用 户 来 说 ,这 大 大 提升 了 应 用 程序 的 确定 性 。 
上 面 的 命令 行 输出 是 运行 JRockit R27 版 本 所 得 ， 对 于 R28 版本， 若 想 使 用 
非 标准 的 垃圾 回收 策略 需要 在 命令 行 中 显 式 指定 ,R28 版 本 中 默认 使 用 分 代 式 并 
行 标记 清理 垃圾 回收 策略 ( 以 最 大 化 吞吐 量 为 主要 目标 ) 。 此 外 ， 在 R28 版 本 
P, 内存 管理 系统 仍 会 根据 运行 时 反馈 信息 ， 自 适应 地 调整 垃圾 回收 器 的 各 种 行 
为 ， 但 调整 程度 低 于 R27 版 本 。 
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前 面 例子 中 的 垃圾 回收 器 都 是 用 了 并 行 标记 清理 算法 ,目标 在 于 最 大 化 吞吐 量 。 但 在 应 用 程 
序 运行 过 程 中 ，JVM 仍 可 基于 运行 时 反馈 信息 ， 自 行 判断 是 否 需要 使 用 新 生 代 区 域 。 应 用 程序 
刚 开始 运行 的 时 候 ， 这 种 改变 可 能 会 比较 频繁 ， 经 过 JVM 热身 ， 并 不 断 收集 反馈 信息 后 ,，JVM 
会 逐步 找到 一 个 比较 合理 的 运行 策略 使 运行 状态 趋 于 稳定 。 如 果 收 集 到 足够 多 的 反馈 信息 , JVM 
找到 另 一 个 更 优 的 运行 策略 后 ，JVM 会 随 之 切换 到 相应 的 策略 继续 运行 。 

















3.5 ”8 近 实时 垃圾 回收 


对 于 垃圾 回收 来 说 ， 契 合 实时 系统 是 个 美好 的 愿望 。 无 论坛 圾 回收 器 把 任务 完成 得 多 漂亮 ， 
只 要 有 垃圾 回收 存在 ,运行 时 就 包含 了 不 确定 性 。 即 使 由 垃圾 回收 引入 的 延迟 可 以 降低 ， 还 可 以 
通过 算法 减少 STW 式 的 操作 ， 但 运行 时 行为 的 不 确定 性 仍 无 法 彻底 消除 。 

那么 ,到底 什么 是 实时 系统 ?事实 上 ,这 个 词 存在 一 定 程度 的 误 用 。 为 了 避免 产生 误解 ， 这 
里 将 实时 分 成 软 实 时 (soft real-time ) 和 硬 实时 (hard real-time ) 两 个 概念 分 别 曾 述 。 


3.5.1 RA SRSA 


硬 实时 一 般 指 更 加 传统 的 实时 系统 ， 类 似 合成 器 或 心脏 起 搏 器 之 类 的 ， 要 求 能 够 100% 确 定 
系统 的 行为 ， 而 目前 使 用 自动 内 存 管理 的 运行 时 还 没有 几 个 能 做 到 100% 的 确定 性 ， 至 少 在 不 大 
量 修改 应 用 程序 和 编程 语言 的 构造 以 控制 垃圾 回收 的 情况 下 ， 还 做 不 到 。 

例如 ,为 了 在 Java 中 实现 实时 系统 ，JSR1 中 指定 了 用 于 与 运行 时 交互 的 API ( javax. 
realtime 包 中 的 类 )， 以 便 控制 垃圾 回收 的 运行 。 如 果 是 开发 新 系统 ， 这 还 是 比较 好 办 的 ,但 
对 那些 现存 的 系统 来 说 ， 引 入 新 的 API 和 语义 可 能 会 带 来 巨大 的 风险 ， 有 时 甚至 根本 无 法 完成 。 
即使 技术 上 是 可 行 的 ， 修 改 已 有 系统 的 关键 模块 仍然 代价 不 菲 。 因 此 ， 软 实时 的 概念 应 运 而 生 。 

软 实时 是 指 运行 时 系统 可 以 接受 一 定 程度 的 延迟 ， 并 控制 暂停 时 间 ， 这 样 即 使 应 用 程序 的 行 
为 仍然 存在 不 确定 性 , 单 次 的 暂停 时 间 也 不 会 超过 某 个 阔 值 。 这 也 是 JRockit Real Time 的 实现 基础 。 















































3.5.2 JRockit Real Time 


事实 证 明 , 对 于 大 多 数 要 求 有 一 定 程度 确定 性 的 复杂 系统 来 说 , 能 够 保证 将 暂停 时 间 限 制 在 
某 个 阅 值 之 内 就 足够 了 。 如 果 这 种 保证 顺利 实现 的 话 ， 就 可 以 在 不 修改 已 有 系统 的 情况 下 ,提升 
系统 的 确定 性 ， 并 降低 系统 延迟 。 

JRockit Real Time 的 主要 卖点 就 是 可 以 在 不 修改 已 有 系统 的 情况 下 保证 系统 有 稳定 的 延迟 ， 
即 插 即 用 ,用 户 只 需 在 命令 行 参数 中 指定 期 望 的 暂停 时 间 。 对 当前 运行 在 现代 CPU 架构 的 JRockit 
发 行 版 来 说 ， 维 持 毫 秒 级 别 的 暂停 时 间 根 本 不 是 什么 问题 。 

但 事情 并 没有 这 么 简单 ， 正 如 3.3 节 中 介绍 的 ， 低 延迟 的 代价 是 垃圾 回收 整体 时 间 的 延长 。 
相 比 于 并 行 垃圾 回收 , 在 程序 运行 的 同时 并 发 垃圾 回收 的 难度 更 大 ,而 频繁 中 断 垃圾 回收 则 可 能 
带 来 更 多 的 麻烦 。 事 实 上 ， 这 并 非 什么 大 问题 ， 因 为 大 多 数 使 用 耻 ockitReal Time 的 用 户 更 关心 
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系统 的 可 预测 性 ， 而 不 是 减少 垃圾 回收 的 总 体 时 间 。 大 多 数 用 户 认为 暂停 时 间 的 突然 增长 比 垃圾 
回收 总 体 时 间 的 延长 更 具 危 害 性 。 

下 面 是 应 用 程序 的 响应 时 间 的 变化 图 , 是 在 WebLogic SIP Server 上 运行 一 个 电信 系统 得 出 的 
结果 ， 这 里 并 没有 启用 JRockit Real Time。 从 图 中 可 以 看 出 ， 平 均 响 应 时 间 的 方差 比较 大 。 


























99 分 位 响应 时 间 : 113 毫 秒 
平均 响应 时 间 : 22.729 毫 秒 





















































































































































时 间 (E) 





1. 软 实时 的 有 效 性 

软 实时 是 JRockit Real Time 的 核心 机 制 。 但 非 确定 性 系统 如 何 提供 指定 程度 的 确定 性 ， 例 如 
像 垃圾 回收 费 这 样 的 系统 如 何 保证 应 用 程序 的 暂停 时 间 不 会 超过 某 个 闷 值 ? 严格 来 说 , 无 法 提供 
这 样 的 保证 ， 但 由 于 这 样 的 极端 案例 很 少 ， 所 以 也 就 无 关 紧要 了 。 

当然 , 没有 什么 万 全 之 策 , 确实 存在 无 法 保证 暂停 时 间 的 场景 。 但 实践 证 明 ， 对 于 那些 堆 中 
存活 对 象 约 占 30% ~ 50% 的 应 用 程序 来 说 ，JRockit Real Time 的 表现 可 以 满足 服务 需要 ， 而 且 随 
着 JRockit Real Time 各 个 版 本 的 发 行 ，30% ~ 50% 这 个 阔 值 在 不 断 提 升 ， 可 支持 的 暂停 时 间 阔 值 
则 不 断 降 低 。 

如 果实 现 应 用 程序 时 无 法 使 用 Rockit Real Time， 那 么 还 可 以 通过 其 他 一 些 方法 调 优 垃圾 回 
收 器 。 在 排查 应 用 程序 延迟 过 高 的 问题 时 ， 除 了 垃圾 回收 器 的 相关 因素 外 ,还 要 注意 用 户 应 用 程 
序 自身 实现 的 问题 ， 很 多 时 候 应 用 程序 中 对 锁 的 不 当 使 用 是 造成 延迟 过 高 的 主要 原因 。JRockit 
Mission Control 中 包含 了 一 些 诊断 工具 ， 有 助 于 排查 相关 问题 。 















































我 们 常 可 以 听 到 某 交 易 系 统 由 于 更 低 的 延迟 和 更 快 的 响应 时 间 ,每 天 可 以 多 
赚 几 万 美元 的 成 功 案例 。 该 系统 使 用 同一 硬件 就 可 以 使 交易 量 明显 提升 ， 因 为 他 
们 要 做 的 唯一 改变 就 是 ， 使 用 JRockit Real Time. 





















































下 图 与 之 前 的 统计 图 运行 的 是 同一 个 程序 ， 唯 一 的 区 别 在 于 启用 了 JRockit Real Time， 通 过 
命令 行 参 数 -xpauseTarget 将 期 望 暂停 时 间 的 最 大 值 设置 为 10 毫秒 。 从 图 中 可 以 看 到 , 热身 阶 
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Bola, JVM 的 行为 就 趋 于 稳定 了 。 





99 分 位 响应 时 间 : 24 毫 秒 
平均 响应 时 间 : 6.689 毫 秒 






























































人 们 可 能 会 认为 ， E E 

GS 的 各 种 尝试 所 致 ， 例 如 在 这 阶段 可 能 做 了 大 量 的 代码 优化 工作 。 事 实 上 ， 确 实 
这 样 ， 但 单 就 这 个 基准 测试 来 说 ， 最 开始 那 部 分 延迟 的 拌 动 是 因为 Java ane 
序 中 隐藏 的 错误 而 导致 ,与 垃圾 回收 和 自 适应 优化 无 关 。 这 个 问题 后 来 已 被 修复 。 








而 且 我 们 注意 到 ,对 于 设 定 的 10 毫秒 响应 时 间 的 目标 ,JRockit Real Time 毫 无 压力 ， 只 不 过 
是 垃圾 回收 的 总 体 时 间 稍 稍 延长 而 已 。 

2. 工作 原理 

那么 JRockit 如 何 实现 如 此 高 性 能 的 垃圾 回收 呢 ? 关键 点 有 三 个 : 
口 高 效 的 并 行 执行 
口 细 分 垃圾 回收 过 程 ， 将 之 变 成 几 个 可 回 滚 、 可 中 断 的 子 任务 (work packet ) 
O 高 效 的 启发 式 算法 

高 效 的 并 行 执 行 ( efficient parallelization ) 并 不 是 什么 新 概念 。 并 发 垃圾 回收 需 早 已 出 现 了 ， 
JRockit Real Time 在 处 理 并 发 问题 时 几乎 没有 概念 的 改变 或 技术 飞 牙 ， 更 多 的 是 对 细节 的 处 理 ， 
例如 确保 同步 操作 高 效 完 成 ， 尽 可 能 避免 锁 操 作 ， 确 保 已 有 的 锁 操 作 不 会 饱和 ， 以 及 高 效 的 工作 
线程 调度 算法 。 

事实 上 ， 实 现 低 延迟 的 关键 仍 是 尽 可 能 多 让 Java 应 用 程序 运行 ， 保 持 堆 的 使 用 率 和 碎片 化 
程度 在 一 个 较 低 的 水 平 。 在 这 一 点 上 ， Rockit Real Time 使 用 的 是 贪心 策略 ， 即 尽 可 和 6 推迟 STW 
式 的 垃圾 回收 操作 ， 和 希望 问题 能 够 由 应 用 程序 自身 解决 ， 或 者 能 够 减少 不 得 不 执行 STW 式 操作 
的 情况 ， 最 好 在 具体 执行 的 时 候 需 要 处 理 的 对 象 也 尽 可 能 少 一 些 。 

JRockit Real Time 中 ， 垃 圾 回收 器 的 工作 被 划分 为 几 个 子 任务 。 如 果 在 执行 其 中 某 个 子 任务 
时 (例如 整理 堆 中 的 某 一 部 分 内 存 )， 应 用 程序 的 暂停 时 间 超 过 了 阔 值 ， 那 么 就 放弃 该 子 任务 ， 
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恢复 应 用 程序 的 执行 。 用 户 根据 业务 需要 指定 可 用 于 完成 垃圾 回收 的 总 体 时 间 ， 有 些 时 候 ， 某 些 
子 任务 已 经 完成 , 但 没有 足够 的 时 间 完 成 整个 垃圾 回收 工作 , 这 时 为 了 保证 应 用 程序 的 运行 , 不 
得 不 废弃 还 未 完成 的 子 任务 ， 待 到 下 次 垃圾 回收 的 时 候 再 重新 执行 ,指定 的 响应 时 间 越 短 ， 则 废 
弃 的 子 任务 可 能 越 多 。 

前 面 介绍 过 的 标记 阶段 的 工作 比较 容易 调整 ,可 以 与 应 用 程序 并 发 执行 。 但 清理 和 整理 阶段 
则 需要 暂停 应 用 程序 线程 (STW )。 幸 运 的 是 ， 标 记 阶 段 会 占 到 垃圾 回收 总 体 时 间 的 90%。 如 果 
暂停 应 用 程序 的 时 间 过 长 ， 则 不 得 不 终止 当前 垃圾 回收 任务 ,重新 并 发 执行 , 期望 问题 可 以 自动 
解决 。 之 所 以 将 垃圾 回收 划分 为 几 个 子 任务 就 是 为 了 便于 这 一 目标 的 实现 。 

当然 , 这 其 中 还 涉及 几 种 启发 式 算法 的 使 用 , 对 运行 时 系统 的 简单 改造 可 以 帮助 JRockit Real 
Time 更 好 地 制定 决策 ， 例 如 使 用 更 复杂 的 写 屏 障 来 跟踪 每 个 线程 中 被 标记 为 脏 的 卡片 数量 。 
此 代码 的 执行 时 间 会 比 传统 的 垃圾 回收 中 写 屏障 的 执行 时 间 稍 长 , 但 可 以 为 分 析 垃 圾 回收 的 行为 
提供 更 详细 的 数据 。 如 果 某 个 线程 的 写 操作 明显 多 于 其 他 线程 , 那么 就 需要 运行 时 系统 对 该 线程 
特别 注意 ， 做 一 些 相关 优化 。 此 外 ， 了 下 ockit 还 统计 单个 线程 中 所 执行 的 所 有 写 屏障 操作 ， 以 便 
优化 相关 性 能 。 


3.6 ”内存 操作 相关 的 API 


本 节 将 介绍 Java 编程 语言 中 与 内 存 管 理 相关 的 内 容 。 

在 Java 中 ， 亡 图 自己 操作 内 存 ， 脱 离 垃圾 回收 器 的 管理 (例如 即使 对 象 已 经 变 成 垃圾 ， 但 
坚持 不 回收 )， 绝 对 是 自 讨 苦 吃 。 但 Java 也 提供 了 相应 的 机 制 来 提醒 (hint) 垃圾 回收 顺 工 作 ， 
这 些 机 制 有 利 有 弊 ， 在 使 用 的 时 候 需 要 特别 注意 。 


3.6.1 析 构 方法 


从 Java 1.0 起 , 每 个 Java 对 象 都 包含 一 个 finalize WE, 用 户 可 以 覆盖 该 方法 以 完成 自 定 
义 析 构 操作 。 按 照 说 明文 档 ，finalize 方法 会 在 该 对 象 被 当 作 垃圾 回收 之 前 调用 ,单纯 这 样 看 
的 话 , 将 之 作为 对 象 的 析 构 函数 来 执行 一 些 清理 操作 ( 例如 关闭 已 经 打开 的 文件 句柄 ) 是 个 不 错 
的 主意 。 

但 事实 上 没 这 样 简单 ， 由 于 finalize 方法 中 可 能 会 包含 任何 代码 ， 可 能 会 造成 系统 故障 ， 
例如 在 finalize 方法 中 将 已 经 成 为 垃圾 的 对 象 复活 , 或 者 依照 垃圾 对 象 克隆 了 一 个 新 对 象 , 于 
是 垃圾 回收 器 就 不 会 再 将 之 回收 了 。 此 外 , 如 果 在 finalize 方法 中 释放 系统 资源 ( 例如 释放 文 
件 句 柄 )， 则 可 能 会 导致 资源 无 法 被 充分 利用 ， 因 为 无 法 保证 析 构 函数 会 在 何 时 被 执行 。 因 此 ， 
对 系统 资源 的 释放 应 该 由 程序 员 显 式 控制 。 

进一步 讲 ，finalize 方法 可 能 会 被 任意 线程 在 任意 时 间 调 用 ,无 论 该 线程 当前 持 有 哪个 对 
象 的 锁 ， 都 可 以 正常 执行 。 这 非常 危险 ， 可 能 会 导致 死 锁 的 出 现 ， 还 有 可 能 会 违反 Java 自身 的 
语义 。 
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“Java 中 的 析 构 函数 的 设计 就 是 一 个 失误 ,应 避免 使 用 。” 这 不 仅仅 是 我 们 的 意见 ,也 是 Java 
社区 的 一 致意 见 。 


3.6.2 Java 中 的 引用 


很 多 人 以 为 Java 中 只 有 一 种 引用 ， 对 象 只 分 为 可 达 和 不 可 达 两 种 ， 而 后 一 种 会 被 垃圾 回收 
器 处 理 掉 。 但 事实 上 ，Java 中 存在 多 种 引用 ， 可 以 认为 是 “对 处 于 不 同 存活 程度 的 对 象 的 描述 ”。 
普通 对 象 的 引用 称 为 强 引用 。 

几 种 对 象 引 用 类 型 位 于 java.lang.ref 包 下 , 均 继 承 自 java.lang.ref.Referenc Ze, 
所 有 的 Reference 类 型 的 实例 都 有 一 个 get 方法 用 于 获取 当前 引用 所 指向 的 实际 对 象 , 如 果 对 
象 是 不 可 达 的 ， 例 如 已 经 被 回收 了 ， 则 get 方法 返回 nullo 

当 对 象 的 可 达 性 发 生变 化 时 会 被 放 和 人 到 Gava.lang.ref.ReferenceQueue 类 的 实例 中 ， 
例如 引用 对 象 要 被 回收 掉 的 时 候 。 在 创建 引用 对 象 时 ， 可 以 将 之 与 某 个 java.lang.ref. 
ReferenceQueue 的 实例 绑 定 ， 通 过 对 ReferenceQueue 实例 的 轮 询 ， 可 以 得 知 对 象 会 在 何 时 
被 回收 掉 。 

Java 中 有 4 类 主要 的 引用 , 除了 强 引 用 (strong reference )， 还 有 弱 引 用 (weak reference )、 
软 引 用 (soft reference ) 和 虚 引 用 (phantom reference )。 

1. 弱 引 用 

弱 引 用 是 指 那些 不 足以 使 对 象 保留 在 内 存 中 的 引用 , 实际 上 , java.lang.ref.WeakReferenc 
类 是 对 强 引用 的 一 个 包装 器 ， 将 其 标明 为 弱 引 用 : 


WeakReference weak = new WeakReference (object); 


在 上 面 的 示例 中 , 弱 引 用 实际 指向 的 对 象 可 以 用 weak.get () 得 到 , 由 于 object 可 能 会 在 
任意 时 刻 被 回收 掉 ， 所 以 weak .get () 方 法 可 能 返回 null. 

弱 引 用 常 作为 缓存 的 key 用 于 java.util.weakHashMap 实例 中 。 当 JVM 执行 垃圾 回收 时 ， 
弱 引 用 所 指向 的 对 象 会 被 释放 掉 ， 这 样 可 以 防止 无 意识 的 内 存 泄漏 。 弱 引用 可 以 看 做 是 Java 中 
可 用 于 防止 内 存 泄漏 的 一 种 内 建 机 制 。 

2. 软 引 用 

作为 一 种 弱 引 用 , 软 引 用 所 指向 的 对 象 , 垃圾 回收 器 会 尽 可 能 将 之 保存 在 内 存 中 , 但 当 内 存 
不 足 时 ,会 首先 将 之 回收 掉 。 

软 引 用 到 底 比 弱 引 用 “ 强 ” 多 少 ， 取 决 于 JVM 的 具体 实现 。 理 论 上 ， 软 引用 可 以 实现 得 与 
弱 引 用 一 样 ， 并 不 违反 Java 的 语义 。 

3. 虚 引 用 

虚 引 用 更 常用 于 实现 析 构 函数 , 用 于 取代 finalize WE. 与 弱 引 用 和 软 引 用 类 似 , 它 也 是 
对 普通 对 和 象 的 包装 ， 只 不 过 其 get 方法 永远 都 返回 null. 

访问 虚 引 用 需要 以 定期 的 间隔 (或 执行 阻塞 remove 操作 ) 轮 询 java.lang.ref.Reference- 
Queue 实例 ， 以 便 得 知 目标 对 象 是 否 要 被 回收 控 了 。 由 于 虚 引 用 的 get 只 会 返回 null, MA 
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法 获取 到 其 所 指向 的 真正 对 象 的 句柄 并 使 其 复活 , 也 就 避免 了 finalize 方法 存在 的 问 


有 了 它 的 优点 。 
下 面 为 使 用 finalize 方法 做 析 构 函数 的 示例 代码 。 


/** 
* 打印 被 回收 的 对 象 的 数量 
Eef. 

public class Finalize { 


static class TestObject { 
static int nObjectsFinalized = 0; 





protected void finalize() throws Throwable { 
System.err.printlin(++nObjectsFinalized) ; 
} 
} 


public static void main(String[] args) { 


Tor ia.) 二 
TestObject o = new TestObject(); 
doStuff (o); 
o = null; // 清 除 指向 对 象 o 的 引用 


System.gc(); // 党 试 强制 执行 垃圾 回收 


} 
下 面 为 使 用 虚 引 用 实现 同样 的 功能 的 示例 代码 。 





/** 
* 使 用 PhantomReferences 打印 被 回收 的 对 象 的 数量 
ay 


import java.lang.ref.*; 


public class Finalize { 
static class TestObject { 
static int nObjectsFinalized = 0; 





static ReferenceQueuex<TestObject> q = 
new ReferenceQueue<TestObject>(); 


public static void main(String[] args) { 
Thread finalizerThread = new Thread() { 


public void run() { 
FGE (33) “fk 
try { 


// 调 用 remove 方法 会 被 阻塞 ， 直 到 有 对 象 被 回收 

Reference ref = q.remove(); 

System.err.printlin(++TestObject .nObjectsFinalized) ; 
} catch (InterruptedException e) { 


题 ， 


又 具 
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finalizerThread.start(); 


FOr bse): £ 
TestObject o = new TestObject(); 
PhantomReference<TestObject> pr = 

new PhantomReference<TestObject>(o, q); 

doStuff(o); 
o = null; // 清 除 指向 对 象 o 的 引用 
System.gc(); // 党 试 强制 执行 垃圾 回收 

} 

} 
} 


3.6.3 JVM 的 行为 差异 


对 于 JVM 来 说 ， 一 定 谨 记 ， 编 程 语言 只 能 提醒 垃圾 回收 器 工作 。 就 Java 而 言 ， 在 设计 上 它 
本 身 并 不 能 精确 控制 内 存 系统 。 例 如 ， 假 设 两 个 JVM 厂商 所 实现 软 引 用 在 缓存 中 具有 相同 的 存 
活 时 间 ， 这 本 就 是 不 切实 际 的 。 

另外 一 个 问题 就 是 大 量 用 户 对 system.gc () 方 法 的 错误 使 用 。system.gc () 方 法 仅仅 是 
提醒 运行 时 “现在 可 以 做 垃圾 回收 了 ”。 在 某 些 JVM 实现 中 ,频繁 调用 该 方法 导致 了 频繁 的 垃圾 
回收 操作 ， 而 在 某 些 JVM 实现 中 ， 大 部 分 时 间 忽略 了 该 调用 。 

我 过 去 任职 为 性 能 顾问 期 间 ， 多 次 看 到 该 方法 被 滥用 。 很 多 时 候 ， 只 是 去 掉 对 system.ge 
方法 的 几 次 调用 就 可 以 大 幅 提 升 性 能 ， 这 也 是 JRockit 中 会 有 命令 行 参 数 -Xxx:AllowSystemGC= 
False 来 禁用 System.gc 方法 的 原因 。 
























































3.7 ”陷阱 与 伪 优 化 


部 分 开发 人 员 在 写 代码 时 ， 有 时 会 写 一 些 “ 经 过 优化 的 ”的 代码 ,期望 可 以 帮助 完成 垃圾 回 
收 的 工作 ， 但 实际 上 ， 这 只 是 他 们 的 错觉 。 记 住 ， 过 早 优化 是 万 恶 之 源 。 就 Java 来 说 ， 很 难 在 
语言 层面 控制 垃圾 回收 的 行为 。 这 里 的 主要 问题 时 , 开发 人 员 误 以 为 垃圾 回收 器 有 固定 的 运行 模 
式 ， 并 万 图 去 控制 它 。 

正如 在 前 面 章 节 中 介绍 的 ，system.gc () 只 是 一 个 提醒 ， 可 能 会 对 整个 堆 执行 STW 式 的 垃 
圾 回收 ， 也 有 可 能 介 于 二 者 之 间 。 

除了 垃圾 回收 外 ， 对 象 池 (object pool) 也 是 Java 中 常见 的 伪 优 化 〈false optimization )。 有 
人 认为 ,保留 一 个 存活 对 象 池 来 重新 使 用 已 创建 的 对 象 可 以 提升 垃圾 回收 的 性 能 ,但 实际 上 ,对 
象 池 不 仅 增 加 了 应 用 程序 的 复杂 度 , 还 很 容易 出 错 。 对 于 现代 垃圾 收集 器 来 说 ,使 用 java. lang. 
ref .Reference 系列 类 实现 缓存 , 或 者 直接 将 无 用 对 象 的 引用 置 为 null 就 好 了 , 不 用 多 操心 。 
此 外 ,长 期 持 有 无 用 的 对 象 其 实 是 个 大 麻烦 ,分 代 式 垃圾 回收 颖 可 以 很 好 地 人 处 理 临 时 对 象 , 但 如 
果 这 些 临时 对 象 被 人 为 保存 下 来 ， 无 法 被 回收 掉 的 话 ， 最 终 就 会 被 提升 到 老年 代 ， 并 将 其 挤 满 。 
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Java 不 是 C++ 


近来 ， 人 们 认为 ， 应 该 添加 控制 Java 垃圾 回收 的 方法 , 添加 free 或 delete 操作 符 ， 以 及 
打开 和 关闭 垃圾 回收 的 方法 , 另外 一 个 例子 是 想 直 接 访问 或 修改 JVM 中 的 本 地 指针 。 不 得 不 说 ， 
如 果真 的 在 Java 中 引入 了 这 些 “ 特 性 ”， 对 于 编写 Java 程序 来 说 将 会 是 非常 危险 的 , 想 要 用 好 这 
些 “ 特 性 ”实在 太 难 。 

自动 内 存 管理 有 利 有 弊 ， 为 人 诉 病 的 地 方 主 要 在 于 其 不 确定 性 ， 耻 ockit Real Time 试图 在 不 
修改 应 用 程序 ， 不 操作 垃圾 回收 器 的 前 提 下 ， 通 过 其 他 的 方式 来 绕 过 这 个 问题 。 












































BAG AB HH RL TAZ JavaOne 1999 年 的 会 议 上 ， 有 关 “Java 应 该 
有 free 操作 符 ” 的 讨论 攻陷 了 整个 HotSpot 议题 。 发 起 这 个 讨论 的 家 伙 ， 第 一 
铅 的 经 典 台 词 就 是 “我 有 很 多 从 事 C++ 开 发 的 朋友 ……” 


事实 上 , 基于 现代 JVM, 如 果 能 够 合理 利用 书本 上 的 技巧 , 例如 正确 使 用 java.lang.ref. 
Reference 系列 类 ， 注 意 Java 的 动态 特性 ， 完 全 可 以 写 出 运行 良好 的 应 用 程序 。 如 果 应 用 程序 
真 的 有 实时 性 要 求 ， 那 么 一 开始 就 不 该 用 Java 编写 ， 而 应 该 使 用 那些 由 程序 员 手 动 控制 内 存 的 
静态 编程 语言 来 实现 应 用 程序 。 
作为 一 个 强 有 力 的 辅助 特性 ， 自 动 内 存 管理 可 以 缩短 开发 周期 ， 降低 应 用 程序 复杂 度 , 但 它 
并 不 能 解决 所 有 问题 。 


3.8 JRockit 中 的 内 存 管 理 
本 节 将 简单 介绍 JRockit 垃圾 回收 相关 的 命令 行 开关 ， 更 多 高 级 的 内 存 操作 请 参见 第 5 章 。 


3.8.1 基本 参数 


本 节 将 介绍 与 Rockit 内 存 管 理 相关 的 基本 命令 行 开关 。 

1. 打印 垃圾 回收 日 志 

运行 JRockit 时 ， 附 加 命令 行 参数 -xverbose:gc 会 打印 出 很 多 JVM 内 存 管理 相关 的 信息 ， 
其 中 包含 了 垃圾 回收 的 发 生地 点 ( 新 生 代 或 老年 代 )、 垃 圾 回收 策略 的 变更 以 及 执行 垃圾 回收 所 
消耗 的 时 间 。 

除了 使 用 JRockit Mission Control 外 ， 命 令 行 参数 -Xverbose:gc (或 者 -Xverbose:memory ) 
也 可 算是 学 习 垃 圾 回收 器 具体 行为 的 一 种 工具 。 

下 面 是 使 用 -Xverbose:gc 参数 运行 示例 应 用 程序 时 打印 的 日 志 。 

hastur:material marcus$ java -Xverbose:gc GarbageDemo 

[INFO ] [memory ] GC mode: Garbage collection optimized for 

throughput, strategy: Generational Parallel Mark & Sweep. 


[INFO ] [memory ] Heap size: 65536KB, maximal heap size: 
382140KB, nursery size: 32768KB. 
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[INFO ][memory ] [YC#1] 1.028-1.077: YC 33232KB->16133KB 

(65536KB), 0.049 s, sum of pauses 48.474 ms, longest pause 48.474 ms. 
[INFO ] [memory ] [YC#2] 1.195-1.272: YC 41091KB->34565KB 

(65536KB), 0.077 s, sum of pauses 76.850 ms, longest pause 76.850 ms. 
[INFO ][memory ] [YC#3] 1.857-1.902: YC 59587KB->65536KB 

(65536KB), 0.045 s, sum of pauses 45.122 ms, longest pause 45.122 ms. 
[INFO ] [memory ] [OC#1] 1.902-1.912: OC 65536KB->15561KB 

(78644KB), 0.010 s, sum of pauses 9.078 ms, longest pause 9.078 ms. 
[INFO ][memory ] [YC#4] 2.073-2.117: YC 48711KB->39530KB 

(78644KB), 0.044 s, sum of pauses 44.435 ms, longest pause 44.435 ms. 


一 般 情 况 下 ， 日 志 中 会 包含 垃圾 回收 策略 变更 信息 , 堆 容 量 调整 信息 ， 以 及 垃圾 回收 的 执行 
开始 时 间 和 执行 时 长 。 

其 中 , oc 和 Yc 分 别 表 示 老 年 代 垃 圾 回收 (old collection ) 和 新 生 代 垃圾 回收 (nursery collection ), 
后 跟 垃 圾 回收 操作 的 序号 ， 起 始 值 为 1。 























再 之 后 ， 是 本 次 垃圾 回收 的 起 始 和 截止 时 间 ， 其 具体 值 是 从 JVM 启动 之 后 的 时 间 偏 移 ， 单 
位 为 秒 。 
接 下 来 是 , 垃圾 回收 前 后 ,相关 区 域 的 内 存 占 用 情况 , 分别 是 回收 前 、 回 收 后 和 总 容量 。 在 


此 之 后 是 对 该 区 域 垃圾 回收 所 消耗 的 时 间 。 

最 后 , 是 本 次 垃圾 回收 的 暂停 总 时 间 ， 以 及 在 本 次 垃圾 回收 中 最 长 单 次 暂停 时 间 。 通 过 上 面 
的 示例 可 以 推断 出 ,垃圾 回收 是 完全 STW 式 的 ， 即 并 行 垃圾 回收 ,其 执行 过 程 只 有 一 个 长 暂停 。 

正如 之 前 章节 介绍 的 , 垃圾 回收 周期 中 实际 上 包含 了 几 个 阶段 ,如 果 想 要 获取 更 多 详细 信息 ， 
请 使 用 -Xverbose:gcpause 参数 。 此 外 ,在 JRockit Mission Control 中 可 以 以 图 形 化 的 方式 查 
看 垃圾 回收 的 具体 细节 ， 以 及 更 多 应 用 程序 相关 的 信息 。 

2. 设置 堆 的 初始 值 和 最 大 值 

参数 -xmx 和 -xms 是 所 有 JVM 通用 的 标准 参数 ， 分 别 用 于 指定 堆 的 最 大 值 和 初始 值 。 如 果 
没有 设置 , 则 堆 的 大 小 可 能 会 在 应 用 程序 运行 过 程 中 , 依据 运行 时 反馈 信息 增 大 或 缩小 。 以 下 面 
的 配置 为 例 : 


java -Xms1024M -Xmx2048M <application> 


上 面 的 配置 将 堆 的 初始 值 设置 为 1GB, 最 大 值 为 2GB, 如 果 应 用 程序 所 使 用 的 内 存 超过 2 GB, 
则 JVM 会 抛 出 outofMemoryError 错误 。 

3. 设置 垃圾 回收 器 的 执行 目标 

除非 你 明确 知道 自己 在 做 什么 , 否则 最 好 使 用 -XgcPrio 参数 来 设置 垃圾 回收 器 的 优化 目标 。 
相对 于 固定 的 垃圾 回收 策略 ，JRockit 中 的 垃圾 回收 器 会 根据 优化 目标 和 运行 时 反馈 信息 来 调整 
垃圾 回收 策略 。 
口 -xgcPrio:throughput: 主要 优化 吞吐 量 ， 不 关心 响应 时 间 。 
O -xgcPrio:pausetime: 主要 优化 低 延 迟 。 
O -XgcPrio:deterministic: 该 参数 会 启用 JRockit Real Time， 以 消耗 额外 的 系统 资源 

换取 极 短 的 暂停 时 间 。 
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如 果 以 暂停 时 间 为 优化 目标 的 话 ( 不 适用 于 -xgcPrio:throughput )， 可 以 设置 参数 
-XpauseTarget。 根 据 堆 中 存活 对 象 的 数量 和 系统 配置 ，JRockit 会 尽量 达到 这 个 期 望 的 暂停 时 
间 ， 但 无 法 确定 会 满足 要 求 ， 需 要 针对 具体 应 用 程序 做 大 量 测试 来 确认 。 

以 下 配置 启用 了 Jrockit Real Time， 并 设置 了 和 暂停 时 间 的 上 限 。 


java -XgcPrio:deterministic -XpauseTarget:5ms <application> 

4. 指定 垃圾 回收 策略 

要 想 进 一 步 控制 垃圾 回收 的 行为 ， 可 以 使 用 -xgc 相关 的 参数 做 详细 的 配置 。 该 系列 参数 用 
于 指定 垃圾 回收 策略 ， 避 免 在 应 用 程序 运行 过 程 中 发 生 改 变 。 相 比 于 使 用 -XgcPrio 系列 参数 ， 
-Xgc 系列 参数 可 以 更 细 粒 度 地 控制 垃圾 回收 策略 。 再 强调 一 次 ， 并 发 和 并 行 分 别 用 于 描述 低 延 
迟 垃圾 回收 和 高 吞吐 垃圾 回收 。-Xgc 系列 参数 如 下 , 其 中 , 分 代 ( generational ) 和 不 分 代 (single 
generational ) 的 区 别 在 于 是 否 启用 了 新 生 代 。 
O -xgc:singlecon: 不 分 代 的 并 发 垃圾 回收 (single generational concurrent )。 
O -xge:gencon: 分 代 式 并 发 垃圾 回收 ( generational concurrent )。 
口 -Xxgc:singlepar: 不 分 代 的 并 行 垃圾 回收 (single generational parallel ). 
O -xgc :genpar: 分 代 式 并 行 垃圾 回收 ( generational parallel ). 


3.8.2 压缩 引用 

正如 前 面 章节 介绍 的 , 当 堆 的 最 大 值 小 于 64 GB 时 , Rockit 默认 会 使 用 某 种 形式 的 引用 压缩 ， 
但 也 可 以 通过 命令 行 参数 -xxcompressedRefs 来 显 式 指定 , 该 命令 行 参数 有 两 个 可 选 参数 , 分 
别 用 于 指定 是 否 启用 引用 压缩 和 所 支持 的 堆 的 大 小 。 

下 面 的 配置 禁用 了 引用 压缩 ， 并 强制 JRockit 使 用 原始 本 地 指针 来 表示 对 象 地 址 : 

java -XXcompressedRefs:enable=false <application> 


下 面 的 配置 启用 了 引用 压缩 ， 并 指定 所 支持 的 堆 的 大 小 是 64 GB: 


java -XXcompressedRefs:enable=true,size=64GB <application> 

































































































































































3.8.3 ”高 级 选项 


需要 注意 的 是 ， 花 大 力气 鼓 的 JVM 参数 并 不 一 定 会 使 应 用 程序 性 能 有 和 多么 大 的 提升 ， 而 且 
反而 可 能 会 干扰 JVM 的 正常 运行 。 

如 果 排 查 到 应 用 程序 的 性 能 瓶颈 在 于 内 存 管理 ， 建 议 使 用 JRockit Mission Control 来 探查 具 
体 原 因 。 本 书后 面 的 章节 会 详细 介绍 如 何 记 录 、 分 析 JRockit 的 运行 信息 。 强 烈 建议 在 动手 修改 
JVM 的 非 标准 参数 之 前 ， 尽 可 能 多 地 收集 应 用 程序 的 运行 信息 。 

垃圾 回收 器 每 一 个 部 分 , 从 旁 路 转换 缓冲 到 堆 的 整理 策略 ， 几 乎 都 可 以 通过 命令 行 参数 加 以 
控制 。 

第 $ 章 会 介绍 一 些 高 级 内 存 管 理 参 数 ， 更 多 与 内 存 管理 相关 的 详细 信息 参见 JRockit 相关 文档 。 
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3.9 小 结 





本 章 详细 介绍 了 自动 内 存 管理 中 的 自 适应 内 存 管理 , 以 及 自 适 应 内 存 管理 如 何 根 据 运 行 时 反 
馈 信息 优化 垃圾 回收 器 的 性 能 

此 外 ， 简 单 介 绍 了 标记 -清理 算法 、 和 暂停 -复制 垃圾 回收 算法 及 其 在 JRockit 中 的 变种 和 具体 
应 用 方式 ， 并 讨论 了 如 何 实现 一 个 具有 较 强 伸缩 性 的 垃圾 回收 器 。 

每 个 垃圾 回收 器 都 会 在 某 个 时 间 点 执行 STW 式 的 操作 , 例如 清理 阶段 或 整理 阶段 。STW xt 
的 操作 导致 应 用 程序 出 现 延 迟 , 在 最 大 化 甜 吐 量 和 最 小 化 延迟 时 间 的 选择 上 , 需要 根据 应 用 程序 
的 目标 仔细 权衡 ， 二 者 难以 兼 得 。 

然后 简单 介绍 了 JRockit Real Time， 该 产品 在 某 种 程度 上 实现 了 确定 性 的 垃圾 回收 和 对 暂停 时 
间 的 控制 , 可 以 在 不 修改 应 用 程序 的 情况 下 大 幅 缩短 应 用 程序 的 响应 时 间 , 并 保持 较 高 的 稳定 性 。 

Java 编程 语言 中 的 某 些 部 分 貌似 有 助 于 控制 垃圾 回收 和 内 存 管理 ， 但 带 来 的 往往 是 伪 优 化 。 
在 非 确定 性 系统 中 , 例如 使 用 了 垃圾 回收 器 这 样 的 系统 , 暴露 出 确定 性 操作 是 非常 危险 的 , 切记 。 
千 万 不 要 以 为 确定 性 操作 可 以 使 像 垃圾 回收 这 样 的 非 确定 性 系统 产生 确定 性 行为 。 

最 后 ， 介 绍 了 JRockit 中 常用 来 控制 内 存 管 理 的 命令 行 参 数 。 

至 此 ， ae 介绍 了 自 适 应 运行 时 环境 中 的 代码 生成 和 内 存 管理 ， 下 一 章 将 会 介绍 组 成 
Java 运 errr ae 







































































线程 与 同步 








本 章 将 详细 介绍 Java 与 JVM 中 的 线程 和 同步 。 线 程 用 于 在 单 进程 中 实现 多 任务 的 并 行 执行 ， 
锁 用 于 控制 对 临界 区 〈 critical section ) 的 同步 访问 ， 这 些 是 实现 并 行 化 任务 执行 的 基本 要 素 。 
在 本 章 中 ， 你 将 学 到 如 下 内 容 。 
口 Java 中 线程 与 同步 的 基本 概念 ， 如 何 利用 Java API 实 现 同步 ， 一 些 关 键 字 ， 包 括 wait, 
notify、 常 被 误 用 的 volatile 以 及 java.util.concurrent 包 。 
口 Java 内 存 模型 及 其 存在 的 必要 性 。 理 解 Java 内 存 模型 ， 是 编写 多 线程 应 用 程序 的 关键 。 
O JVM 如 何 高 效 实现 多 线程 与 同步 操作 。 本 章 将 讲解 几 种 不 同 的 线程 模型 。 
O 在 自 适 应 运行 时 反馈 的 基础 上 ，JVM 如 何 使 用 不 同类 型 的 锁 、 锁 策略 和 代码 优化 策略 优 
化 线程 和 同步 操作 。 
口 避 开 并 行 编程 陷阱 和 伪 优 化 , 以 及 java.lang.Thread 类 中 已 废弃 的 方法 和 双 检 查 锁 缺陷 。 
口 如 何 调整 JRockit 中 线程 与 同步 的 运行 行为 ， 以 及 如 何 分 析 锁 的 运行 情况 。 


4.1 基本 概念 


Java 从 诞生 之 初 起 就 在 语言 级 别 支 持 并 行 编程 ， 例 如 内 建 的 java. lang. Thread 类 是 对 操 
作 系 统 中 线程 的 抽象 , 还 有 用 于 同步 操作 的 关键 字 synchronized, WR wait M notify WK. 
这 在 当时 是 独一无二 的 ,至 少 在 学 术 界 以 外 是 这 样 的 。 那 时 ， 商 界 编程 语言 还 依赖 于 操作 系统 提 
供 的 支持 库 来 使 用 线程 ， 而 Java 提供 了 与 平台 无 关 的 方式 来 操作 线程 ， 与 以 往 相 比 ， 这 可 谓 是 
一 大 突破 。 

就 同步 操作 来 说 ，Java 做 得 非常 好 ， 这 不 仅 是 因为 它 显 式 地 支持 线程 、 锁 和 信和 号 量 ， 而 且 其 
内 建 机 制 使 每 个 对 象 都 可 以 作为 监视 器 使 用 。Java 1.5 引 入 了 java.util.concurrent 包 , 其 
中 包含 了 很 多 设计 精巧 、 可 用 于 并 行 编程 的 数据 结构 。 


| 监视 器 用 于 对 需要 同步 的 资源 加 锁 , 每 次 只 能 有 一 个 线程 持 有 该 监视 器 ， 因 | 



















































































此 可 以 实现 对 资源 的 排他 性 访问 。 











这 种 设计 的 优势 很 明显 : 同步 操作 无 须 涉及 第 三 方 库 的 调用 , 而 且 可 以 使 锁具 有 完 
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在 编程 的 时 候 便于 使 用 。 
硬 要 说 缺点 的 话 ， 就 是 使 用 起 来 太 容易 了 ， 有 些 人 可 能 会 滥用 同步 操作 ,结果 导致 应 用 程序 
的 整体 性 能 大 幅 下 降 。 


当然 , 在 具体 实现 上 面 还 有 一 些 可 优化 的 地 方 。 由 于 每 个 对 象 都 可 以 作为 监视 器 使 用 ,每 个 
对 象 都 持 有 与 同步 操作 相关 的 信息 , 例如 当前 对 象 是 否 作为 锁 使 用 ,以 及 锁 的 具体 实现 等 。 一 般 
情况 下 ,为 了 便于 快速 访问 ， 这些 信息 被 保存 在 每 个 对 象 的 对 象 尖 的 锁 字 Clock word) 中 。 SA 
动 内 存 管理 类 似 , 性 能 优化 的 问题 在 多 线程 操作 中 同样 存在 。 因 此 ， 必 须 能 够 快速 获取 目标 对 象 
的 垃圾 回收 信息 , 例如 其 垃圾 回收 状态 。 第 3 章 介 绍 引 用 跟踪 垃圾 回收 时 提 到 的 标记 位 就 记录 了 
这 类 信息 。JRockit 使 用 锁 字 中 的 一 些 位 来 存储 垃圾 回收 状态 信息 ， 虽 然 其 中 包含 了 垃圾 回收 信 
A, 但 是 本 书 还 是 称 之 为 锁 字 。 

如 果 将 对 象 关中 存储 的 信息 过 度 编码 的 话 , 那么 在 使 用 的 时 候 , 就 不 得 不 花 额 外 的 力气 去 解 
码 ; 如 果 不 经 编码 直接 存储 ， 又 会 消耗 大 量 的 内 存 。 因 此 , 在 存储 每 个 对 象 的 锁 信 息 和 垃圾 回收 
言 息 时 ， 需 要 仔细 权衡 。 

对 象 头 还 包含 了 指向 类 型 信息 的 指针 ， 在 JRockit 中 ， 这 称 为 类 块 (class block )。 

下 图 是 JRockit 中 Java 对 象 在 不 同 的 CPU 平台 上 的 内 存 布局 。 为 了 节省 内 存 , 并 加 速 解 引用 
操作 ， 对 象 头 中 所 有 字 的 长 度 是 32 位 。 类 块 是 一 个 32 位 的 指针 ， 指 向 另 一 个 外 部 结构 ， 该 结构 
包含 了 当前 对 象 的 类 型 信息 和 虚 分 派 表 (virtual dispatch table ) 等 信息 。 















































X86, IA64 SPARC 
类 所 
锁 字 类 块 








对 象 数据 对 象 数 据 


就 目前 来 看 ， 在 绝 大 部 分 JVM (包括 JRockit ) 中 ， 对 象 头 是 使 用 两 个 32 位 长 的 字 来 表示 
的 。 在 JRockit 中 ， 偏 移 为 0 的 对 象 指 针 指 向 当前 对 象 的 类 型 信息 ， 接 下 来 是 4 字 节 的 锁 字 。 在 
SPARC 平台 上 ， 对象 头 的 布局 刚好 反 过 来 ， 因 为 在 使 用 原子 指令 操作 指针 时 ， 如 果 没 有 偏 移 的 
Wh, 效率 会 更 高 。 与 锁 字 不 同 ， 类 块 并 不 为 原子 操作 所 使 用 ， 因 此 在 SPARC 平 台 上 ， 类 块 被 放 
在 锁 字 后 面 。 


| m 原子 操作 (atomic operation ) KITENDA 或 全 部 不 执行 的 本 地 指令 。 当 原 | 





























外 令 全 部 执行 时 ， 其 操作 结果 需要 对 所 有 潜在 访问 者 可 见 。 





原子 操作 用 于 读 写 锁 字 ， 具 有 排他 性 ， 这 是 实现 JVM 中 同步 块 的 基础 。 
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研究 表明 ， 在 目前 的 基础 上 ， 再 压缩 对 象 头 ( 例如 将 之 压缩 为 单个 32 位 的 
F) 已 经 没什么 意义 了 。 即 使 这 样 做 可 以 节省 出 更 多 的 内 存 ， 但 在 使 用 的 时 候 需 
要 额外 的 解码 操作 ， 得 不 偿 失 。 


4.1.1 难以 调试 

对 于 大 多 数 平 台 和 编程 语言 来 说 , 并 发 问题 可 能 会 以 多 种 形式 表现 出 来 , 例如 死 锁 (deadlock )、 
活 锁 (livelock ) 和 系统 崩溃 等 ， 它 们 彼此 之 间 没 什么 共性 。 这 个 问题 可 谓 是 老生 常 谈 了 。 由 于 
并 发 问题 往往 与 时 序 相关 ,即便 是 连接 了 调试 器 也 可 能 无 法 重 现 问 题 。 附加 的 调试 器 会 增加 额外 
的 开销 ， 导 致 时 序 变更 。 















































死 锁 是 指 两 个 线程 都 在 等 待 对 方 释放 自己 所 需 的 资源 ,结果 导致 两 个 线程 都 
进入 休眠 状态 。 很 明显 ， 它 们 再 也 醒 不 过 来 了 。 活 锁 的 概念 与 死 锁 类 似 ， 区 别 在 
于 线程 在 竞争 时 会 采取 主动 操作 , 但 无 法 获取 锁 。 这 就 像 两 个 人 面对面 前 进 ， 在 
一 个 很 窄 的 走廊 相遇 ,为 了 能 继续 前 进 , 他 们 都 向 侧面 移动 , 但 由 于 移动 的 方向 
相反 导致 还 是 无 法 前 进 。 





由 于 存在 上 述 问题 , 调试 并 行 系统 是 一 件 非 常 困难 的 任务 ,而 一 些 可 视 化 工具 和 调试 器 可 以 
帮助 解 开 线程 间 的 锁 依 赖 ， 这 对 于 并 发 程序 调试 来 说 ,已 经 是 巨大 的 帮助 了 。 

像 其 他 主流 JVM 一 样 ， 耻 ockit 可 以 在 控制 台 里 输出 当前 应 用 程序 中 所 有 线程 的 调用 栈 ， 并 
打印 锁 的 持 有 者 信息 。 对 于 简单 的 死 锁 问题 来 说 ， 这 些 信 息 已 经 足够 用 来 解决 问题 ,可 以 确定 哪 
些 互相 依赖 的 线程 在 等 待 同一 资源 。 本 章 会 对 此 做 举例 说 明 。 

JRockit Mission Control 套件 提供 了 可 视 化 组 件 来 显示 线程 的 锁 信 息 。 


4.1.2 ”难以 优化 


除了 难以 调试 外 , 在 并 行 编程 中 使 用 锁 还 会 极 大 地 降低 应 用 程序 的 整体 性 能 。 每 个 锁 都 是 一 
个 性 能 瓶颈 ， 它 保证 了 对 临界 区 的 排他 性 访问 , 却 使 得 没有 获取 锁 的 线程 不 得 不 排队 等 待 。 如 果 
锁 放 置 错位 ， 或 者 控制 的 临界 区 过 大 ， 就 会 导致 应 用 程序 的 性 能 大 幅 下 降 。 

不 幸 的 是 , 很 多 商业 软件 的 延迟 问题 就 是 一 两 个 锁 使 用 不 当 导 致 的 , 我 们 调试 第 三 方 应 用 程 
序 时 曾 多 次 遇 到 这 种 情况 , 开发 人 员 自 己 也 没有 意识 到 对 锁 的 错误 使 用 。 幸 运 的 是 , 若 使 用 不 当 
的 锁 不 多 ， 而 且 可 以 识别 出 来 的 话 ， 延 迟 问 题 还 比较 容易 解决 。 再 次 强调 ， 使 用 JRockit Mission 
Control 可 以 很 容易 找到 竞争 最 激烈 的 锁 ， 以 便 排查 问题 。 


| 锁 竞争 激烈 是 指 多 个 线程 花费 大 量 时 间 试 图 获取 某 个 锁 。 ] 
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延迟 分 析 

JRockit Mission Control 套件 附带 了 延迟 分 析 组 件 ， 可 以 记录 Java 应 用 程序 的 运行 信息 ， 提 
供 可 视 化 的 延迟 分 析 数 据 。 在 优化 大 量 使 用 同步 操作 的 应 用 程序 时 , 延迟 分 析 可 以 给 程序 员 带 3 
很 大 的 帮助 。 以 往 的 分 析 工 具 只 是 展示 了 应 用 程序 将 时 间 花 在 了 什么 地 方 , 而 延迟 分 析 仪 则 可 以 
给 出 应 用 程序 没有 花 时 间 在 什么 地 方 。 当 应 用 程序 线程 没有 执行 Java 代码 时 ， 就 将 之 记录 到 线 
程 图 中 ， 这 样 就 可 以 判断 出 ， 线 程 是 在 等 待 7O ， 还 是 在 等 待 获取 锁 。 

















| 第 8 章 和 第 9 章 将 详细 介绍 如 何 使 用 JRockit Mission Control 进行 延迟 分 析 。 | 





下 图 是 JRockit 运行 时 分 析 仪 中 延迟 分 析 标 签 页 的 内 容 ， 其 数据 来 自 于 一 个 正在 运行 的 服务 
带 端 应 用 程序 ， 用 于 做 离线 分 析 。 图 中 的 横 条 标明 了 应 用 程序 线程 都 将 时 间 花 在 了 何 处 , 每 当 出 
现 新 类 型 的 延迟 时 ,就 使 用 一 种 不 同 的 颜色 来 标明 。 时 间 轴 的 顺序 是 最 左 到 右 。 在 图 中 ,线程 绝 
大 部 分 都 是 红色 的 ， 表明 线程 “阻塞 在 Java 中 ”， 这 很 糟 ， 它 表明 应 用 程序 将 时 间 都 花 在 了 等 待 
Java 锁 上 ， 例 如 获取 同步 块 的 锁 。 更 准确 地 说 ， 所 有 非 绿色 的 横 条 都 表示 “没有 在 执行 Java 代 
码 ”， 即 正在 等 待 JO 、 网 络 通信 等 资源 的 本 地 线程 。 
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回忆 一 下 第 3 章 对 延迟 的 讨论 ， 如 果 JVM 将 时 间 都 花 在 垃圾 回收 上 ， 就 无 法 执行 Java 代码 
了 。 类 似 地 ， 如 果 CPU 资源 都 浪费 在 等 待 IO 或 Java 锁 上 ， 就 会 出 现 延 迟 。 这 也 是 大 部 分 性 能 
问题 产生 的 根本 原因 。 





JRockit Flight Recorder 套件 可 以 帮助 定位 Java 程序 中 造成 延迟 的 问题 点 。 在 
上 面 的 合子 中 ， 延 迟 的 根源 在 于 日 志 模 块 中 存在 对 锁 的 不 当 使 用 。 
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4.2 Java API 


AWAIT Java PAEASTRZE ALi, FAAI, CEREREA HE, (Ee th 
用 的 话 ， 也 会 引发 不 小 的 问题 。 








4.2.1 synchronized 关键 字 


在 Java 中 ， 关 键 字 synchronized 用 于 定义 一 个 临界 区 ， 既 可 以 是 一 段 代 码 块 ， 也 可 以 是 
一 个 完整 的 方法 ， 如 下 所 示 。 
public synchronized void setGadget (Gadget g) { 


this.gadget = g; 
} 


上 面 的 方法 定义 中 包含 synchronized 关键 字 ， 因 此 每 次 只 能 有 一 个 线程 修改 给 定 对 象 的 
gadget 域 。 
在 同步 方法 中 ， 监 视 器 对 象 是 隐 式 的 ， 即 当前 对 象 this ， 而 对 静态 同步 方法 来 说 ， 监 视 顺 
对 象 是 当前 对 象 的 类 对 象 。 上 面 的 示例 代码 与 下 面 的 代码 是 等 效 的 。 
public void setGadget (Gadget g) { 
synchronized(this) { 
this.gadget = g; 


} 
} 






































4.2.2 java.lang.Thread 类 


Java 中 使 用 java.lang. Thread 类 表示 对 线程 的 抽象 。 相对 于 操作 系统 的 具体 实现 , Thread 
类 更 具 通 用 性 ,包含 了 启动 线程 和 插入 线程 执行 代码 的 基本 方法 , 与 之 相似 的 是 , 操作 系统 的 线 
程 实现 中 , 由 线程 创建 者 通过 函数 指针 的 形式 指定 新 线程 所 要 执行 的 代码 。Java 以 面向 对 象 的 方 
式 实 现 了 相同 的 语义 ， 任 何 类 ， 只 要 实现 了 java.lang.Runnable 接口 ,或 继承 java.lang. 
Thread 类 ， 均 都 可 以 成 为 一 个 线程 ，run 方法 的 具体 实现 将 是 新 线程 的 具体 执行 代码 。 

Java 中 的 线程 也 有 优先 级 概念 ， 但 是 否 真 的 起 作用 取决 于 JVM 的 具体 实现 。setPriority 
方法 用 于 设置 线程 的 优先 级 ， 提 示 JVM 该 线程 更 加 重要 或 不 怎么 重要 。 当 然 ， 对 于 大 多 数 JVM 
来 说 ， 显 式 地 修改 线程 优先 级 没什么 大 帮助 。 当 运行 时 “有 更 好 的 方案 ”时 ，JRockit JVM 甚至 
会 忽略 Java 线程 的 优先 级 。 

正在 运行 的 线程 可 以 通过 调用 yield 方法 主动 放弃 剩余 的 时 间 片 ， 以 便 其 他 线程 运行 ， 自 
身 休眠 ( 调用 wait 方法 ) 或 等 待 其 他 线程 结束 再 运行 (调用 join 方法 )。 
java.lang.ThreadGroup 类 (线程 组 ) 有 点 像 类 Unix 系统 中 的 进程 ， 其 中 会 包含 多 个 线 
程 ， 对 线程 组 的 操作 会 被 应 用 到 其 中 所 有 的 线程 上 。 

线程 中 使 用 java.lang.ThreadLocal 来 表示 线程 局 部 数据 ， 每 个 线程 都 有 一 份 属 于 自己 
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的 数据 。 该 类 自 Java 1.2 起 引入 ， 是 一 个 非常 有 用 的 机 制 。 对 于 不 能 在 栈 上 分 配 局 部 对 象 的 编程 
语言 来 说 ， 这 可 谓 是 个 笨拙 的 改进 ,但 的 确 可 以 提升 应 用 程序 的 整体 性 能 。 如 果 程 序 员 头 脑 清醒 
的 话 ， 善 用 ThreadLocal 还 是 很 有 帮助 的 。 

自 诞生 以 来 ，java.1lang .Thread 类 发 生 了 很 多 变化 ,废弃 了 一 些 API， 修 改 了 一 些 方法 
实现 。 最 初 ，Thread 类 中 包含 了 用 于 终止 、 挂 起 和 恢复 线程 的 方法 ， 但 实践 表明 ， 使 用 这 些 方 
法 有 风险 ,但 仍 有 人 在 使 用 这 些 方 法 。4.5 节 会 详细 介绍 它们 的 危险 性 。 




































































4.2.3 java.util.concurrent 包 


JDK 1.5 中 引入 的 java.util.concurrent 包 中 提供 了 一 些 对 并 发 编程 非常 有 用 的 数据 结 
构 和 工具 类 ,例如 Blockingoueue 类 , 该 类 是 经 典 的 生产 者 及 消费 者 实现 ， 当 队列 中 空间 不 足 
时 ， 就 阻塞 插入 操作 ， 当 队列 中 没有 元 素 时 ， 就 阻塞 获取 操作 。 

java.util.concurrent 包 使 程序 员 无 须 再 花费 精力 去 “重新 发 明 ” 做 并 发 编程 所 需 的 基 
础 数据 结构 ， 而 且 优 化 包 中 的 类 ， 使 其 具有 良好 的 伸缩 性 和 可 用 性 。 

此 外 ， 在 其 子 包 java.util.concurrent .atomic 中 包含 了 一 些 与 原子 操作 相关 的 工具 类 ， 
例如 java.util.concurrent.atomic.AtomicInteger 类 和 java.util.concurrent.atomic. 
AtomicLong 类 , 可 以 以 原子 操作 的 形式 计算 整 型 和 长 整 型 数据 。 使 用 java.util.concurrent. 
atomic 包 可 以 避免 在 Java 代码 中 显 式 地 使 用 重量 级 锁 。 

HOA, java.util.concurrent.locks 包 中 有 一 些 对 常用 锁 的 实现 ,例如 读 写 锁 ， 这 样 程 
序 员 就 无 须 再 花费 精力 去 从 头 实现 了 。 






































| 读 写 锁 不 限制 读 操 作 ， 但 写 操作 具有 排他 性 。 ] 





信号 量 ( semaphore ) 作为 一 种 同步 机 制 适 用 于 以 下 场景 ， 当 一 个 线程 试图 获取 某 个 资源 时 ， 
却 发 现 该 资源 已 被 其 他 线程 持 有 , 这 时 试图 获取 资源 的 线程 会 被 挂 起 , 直到 资源 持 有 者 线程 释放 
相关 资源 。 信 号 量 是 锁 的 抽象 ,普遍 存在 于 现代 操作 系统 中 ，Java 编程 语言 也 对 其 提供 了 完整 的 
支持 。 
在 Java 中 ， 每 个 对 象 都 继承 自 java.lang.Object 类 ， 有 wait notify Ml notifyAll 这 
几 个 方法 ， 可 以 用 于 实现 信号 量 的 语义 ， 只 不 过 它们 需要 用 在 监视 器 对 象 上 下 文中 ， 例 如 用 在 
synchronized 代码 块 中 ， 否 则 JVM 会 抛 出 TLlegalMonitorStateException 异常 。 
调用 wait 方法 会 将 当前 线程 挂 起 ， 当 它 接收 到 监视 器 的 通知 时 会 被 唤醒 。 当 调用 notify 
方法 时 ,会 根据 JVM 中 的 线程 调度 算法 ， 从 阻塞 在 对 应 监视 器 上 的 线程 中 选择 一 个 ， 将 之 唤醒 ， 
使 其 继续 执行 。 当 调用 notifyall 方法 时 ， 所 有 阻塞 在 监视 器 上 的 线程 都 会 被 唤醒 ,但 只 有 一 个 
会 成 功 得 到 锁 ， 其 余 的 线程 会 再 次 被 挂 起 。 相 对 于 notify 方法 来 说 ，notifyAll 方法 更 安全 ， 
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更 易 避 免 死 锁 ， 但 执行 开销 更 大 一 些 。 所 以 ， 除 非 有 把 握 ， 应 尽量 避免 使 用 notifyAll 方法 。 

调用 wait 方法 时 ， 可 以 附加 一 个 时 间 参 数 ， 用 于 指定 线程 被 挂 起 的 超时 时 间 ， 超 过 该 时 间 
后 ， 线 程 会 自动 醒 来 。 

下 面 的 代码 是 一 个 生产 者 及 消费 者 模型 示例 ， 作 为 消息 端口 (message port) 用 于 展示 如 何 
在 Java 中 使 用 隐 式 监视 器 this 来 同步 控制 。 

public class Mailbox { 


private String message; 
private boolean messagePending; 




















/** 
* 将 消息 放 入 到 收 件 箱 
次 
public synchronized void putMessage(String message) { 
while (messagePending) { // 等 待 消费 者 消费 消息 
try { 
wait(); // 阻 塞 ， 直 到 收 到 通知 
} catch (InterruptedException e) { 
} 
} 


this.message = message; // 将 消息 保存 在 收 件 箱 
messagePending = true; // 设 置 收 件 箱 标 志 
notifyAll(); // 通 知 消费 者 消费 消息 

} 

[** 

* 从 收 件 箱 中 取出 一 条 消息 

ef 


public synchronized String getMessage() { 
while (!messagePending) { // 等 待 生产 者 生产 消息 


try { 
wait(); // 阻 塞 ， 直 到 收 到 通知 


} catch (InterruptedException e) { 
} 
} 


messagePending = false; // 设 置 邮件 箱 标志 
notifyAll(); / /通知 生产 者 生产 消息 


return message; 
} 
} 


在 上 面 的 代码 中 ， 多 个 生产 者 线程 和 消费 者 线程 可 以 使 用 同一 个 Mailbox 对 象 来 同步 控制 
消息 的 发 送 和 接收 。 当 消费 者 线程 调用 getMessage 方法 时 ， 如 果 Mailbox 中 没有 消息 存在 ， 
则 调用 线程 会 被 挂 起 ， 直 到 生产 者 线程 调用 putMessage 方法 填 入 一 个 消息 。 同 样 地 ， 当 生产 
者 线程 调用 putMessage 方法 时 ， 若 邮箱 已 满 ， 则 会 被 挂 起 ， 直 到 消费 者 线程 取 走 消息 。 
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上 面 是 简化 过 的 生产 者 及 消费 者 模型 ,信号 量 的 选择 可 以 是 二 值 的 也 可 以 是 
计数 的 。 在 Mailbox 类 中 ， 信 号 量 就 是 一 个 二 值 的 ， 只 能 为 true A false, 
用 于 控制 对 单个 资源 的 访问 ,计数 信号 量 可 用 于 控制 对 多 个 资源 的 访问 。 具 体 实 
现 可 以 参考 java.util.concurrent.Semaphore 类 ， 该 类 可 以 很 好 地 同步 对 
多 个 资源 的 访问 。 


42.5 volatile 关键 字 


在 多 线程 环境 下 , 对 某 个 属性 域 或 内 存 地 址 进行 写 操作 后 , 其 他 正在 运行 的 线程 未 必 能 立即 
看 到 这 个 结果 。4.3.1 节 将 针对 这 个 问题 做 详细 介绍 。 在 某 些 场景 中 ， 要 求 所 有 线程 在 执行 时 需 
要 得 知 某 个 属性 最 新 的 值 ， 为 此 ，Java 提供 了 关键 字 volatile 来 解决 此 问题 。 

使 用 volatile 修饰 属性 后 ,可 以 保证 对 该 属性 域 的 写 操作 会 直接 作用 到 内 存 中 。 原本, 数 
据 操 作 仅仅 将 数据 写 到 CPU 缓存 中 ， 过 一 会 再 写 到 内 存 中 ， 正 因 如 此 ， 在 同一 个 属性 域 上 , 不 
同 的 线程 可 能 看 到 不 同 的 值 。 目前 , JVM 在 实现 volatile 关键 字 时 , 是 通过 JIT 在 写 属 性 操作 
后 插入 内 存 屏 障 代 码 来 实现 的 ， 只 不 过 这 种 方法 有 一 点 性 能 损耗 。 

人 们 常常 难以 理解 “为 什么 不 同 的 线程 会 在 同一 个 属性 域 上 看 到 不 同 的 值 ”。 一 般 来 说 ， 
前 的 机 器 的 内 存 模型 已 经 足够 强 ,或 者 应 用 程序 的 本 身 结构 就 不 容易 使 非 volatile 属性 出 现 
个 问题 。 但 是 ， 考 虑 到 JIT 优化 编译 器 可 能 会 对 程序 做 较 大 改动 ， 如 果 开 发 人 员 不 留心 的 话 ， 
是 会 出 现 问题 的 。 下 面 的 示例 代码 解释 了 在 Java 程序 中 ， 为 什么 内 存 语义 如 此 重要 ， 尤 其 是 
问题 还 没 表现 出 来 的 时 候 。 


public class MyThread extends Thread { 
private volatile boolean finished; 
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public void run() { 
while (!finished) { 
// 


} 
} 


public void signalDone() { 
this.finished = true; 
} 
} 


如 果 定 义 变量 finished 时 没有 加 上 volatile 关键 字 ， 那 么 在 理论 上 ，JIT 编译 需 在 优化 
时 ,可 能 会 将 之 修改 为 只 在 循环 开始 前 加 载 一 次 finished 的 值 , 但 这 就 改变 了 代码 原本 的 含义 。 
如 果 finished 的 值 是 false, 那么 程序 就 会 陷入 无 限 循 环 , 即使 其 他 线程 调用 了 signalDone 
方法 也 没 用 。 Java 语言 规范 指明 ， 如 果 编 译 器 认为 合适 的 话 ， 可 以 为 非 volatile 变量 在 线程 
内 创建 副本 以 便 后 续 使 用 。 
下 面 的 代码 进一步 描述 了 volatile 关键 字 的 含义 。 
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public class Test { 
volatile int a 
volatile int b 


T; 
E; 


od 


void add() { 
a++; 


b++; 

} 

void print() { 
System.out.printlin(a + " " + b); 


} 
} 


上 面 的 代码 中 ， 关 键 字 volatile 隐 式 地 保证 了 即使 在 多 线程 环境 下 ， 变 量 b 永远 不 会 比 
变量 a Ko WRA ada 方法 定义 加 上 synchronized 关键 字 的 话 , 那么 在 调用 print 方法 时 ， 
打印 出 的 a 和 b 永远 都 是 相等 的 (都 从 1 开始 )。 如 果 变 量 都 没有 使 用 volatile MIH, ada 
方法 也 没有 使 用 synchronized 声明 , 那么 按照 Java 语言 规范 来 说 ， 变 量 a 和 变量 b 就 无 关 。 


| I 内 存 屏 障 来 实现 volatile 关键 字 的 语义 ， 会 导致 CPU 缓 | 




















效 ， 降 低 应 用 程序 整体 性 能 ， 使 用 的 时 候 要 谨慎 。 


一 般 来 说 ， 同 步 操 作 的 开销 会 比 非 同步 操作 大 ， 因 此 ， 程 序 员 应 该 在 不 违反 内 存 语义 的 前 提 
下 ,考虑 使 用 其 他 可 以 传递 数据 的 方法 , 而 不 是 动不动 就 把 volatile 和 synchronized 搬出 来 。 




















4.3 Java 中 线程 与 同步 机 制 的 实现 


本 方 将 介绍 Java 运行 时 中 线程 和 同步 机 制 的 实现 以 及 相关 背景 知识 ， 以 便 读者 可 以 更 好 地 
处 理 并 行 结构 ， 理 解 如 何 使 用 同步 机 制 而 不 会 造成 较 大 的 性 能 损耗 。 


43.1 Java 内 存 模型 


现在 CPU 架构 中 ,普遍 使 用 了 数据 缓存 机 制 以 大 幅 提 升 CPU 对 数据 的 读 写 速度 , 减轻 处 理 
器 总 线 的 竞争 程度 。 正 如 所 有 的 缓存 系统 一 样 ， 这 里 也 存在 一 致 性 问题 ,对 于 多 处 理 器 系统 来 说 
尤其 重要 ， 因 为 多 个 处 理 器 有 可 能 同时 访问 内 存 中 同一 位 置 的 数据 。 

内 存 模型 定义 了 不 同 的 CPU， 在 同时 访问 内 存 中 同一 位 置 时 ， 是 否 会 看 到 相同 的 值 的 情况 。 
强 内 存 模型 (例如 x86 平 台 ) 是 指 ， 当 某 个 CPU 修改 了 某 个 内 存 位 置 的 值 后 ， 其 他 的 CPU 几乎 
自动 就 可 以 看 到 这 个 刚刚 保存 的 值 。 在 这 种 内 存 模型 之 下 , 内 存 写 操作 的 执行 顺序 与 代码 中 的 排 
列 顺序 相同 。 弱 内 存 模型 (例如 IA-64 平台 ) 是 指 ， 当 某 个 CPU 修改 了 某 个 内 存 位 置 的 值 后 ， 
其 他 的 CPU 不 一 定 可 以 看 到 这 个 刚刚 保存 的 值 ( 除非 CPU 在 执行 写 操作 时 附 有 特殊 的 内 存 屏障 
类 指令 ), 更 普遍 低 说 , 所 有 由 Java 程序 引起 的 内 存 访 问 都 应 该 对 其 他 所 有 CPU 可 见 , 但 事实 上 
却 不 能 保证 立即 可 见 。 
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不 同 硬件 平台 上 对 于 “ 读 - 写 ”“ 写 - 读 "”“ 写 - 写 ” 操 作 的 处 理 有 细微 区 别 。Java 为 了 屏蔽 人 硬 
件 区 别 定义 了 JVM 对 这 些 操作 的 具体 处 理 方式 。 对 于 像 C++ 这 样 会 编译 为 平台 相关 代码 ， 而 且 
缺少 内 存 模 型 的 的 静态 编程 语言 来 说 , 在 操作 读 写 时 就 需要 仔细 考虑 不 同 平台 之 间 的 区 别 。 尽 管 
C++ 中 也 有 volatile 关键 字 , 但 应 用 程序 的 具体 行为 还 无 法 独立 于 其 所 在 的 系统 平台 。 此 外 ， 
在 C++ 中 ,部 分 “实际 的 ”内 存 模型 并 不 属于 编程 语言 自身 ， 而 是 由 线程 库 和 操作 系统 调用 决定 的 。 
在 Intel IA-64 这 种 弱 内 存 模型 的 CPU 架构 上 ， 程 序 员 有 时 甚至 会 在 代码 中 显 式 使 用 内 存 屏障 。 总 
之 , 一 旦 C++ 源 代码 在 某 个 系统 平台 上 完成 编译 ， 应 用 程序 的 行为 就 不 会 再 发 生 改 变 了 。 

Java 是 如 何 保证 在 所 有 支持 的 平台 上 具有 相同 的 行为 呢 ? 在 Java 编程 语言 中 并 不 存在 内 存 
屏障 这 东西 ， 而 且 考 虑 到 Java 所 追求 的 平台 无 关 性 ， 也 不 应 该 存在 。 

1. 早期 内 存 模型 中 的 问题 

自 诞生 之 初 , Java 就 明确 了 要 有 一 个 统一 的 内 存 模型 , 以便 在 不 同 的 硬件 平台 上 能 够 有 一 致 的 
行为 。 从 Java 的 1.0 版 本 到 1.4 版 本 ， 在 实现 内 存 模型 的 时 候 都 是 按照 原始 的 Java 语 言 规范 做 的 。 
但 是 ， 第 一 版 的 Java 内 存 模型 中 存在 着 严重 的 问题 ， 实 际 使 用 时 ， 会 导致 无 法 达到 预期 效果 ， 
而 且 有 时 还 会 使 编译 器 的 优化 失效 。 

原始 内 存 模型 允许 编译 器 对 操作 volatile 变量 和 非 volatile 变量 重新 排序 。 以 下 面 的 
代码 为 例 。 

volatile int x; 


ee 
volatile boolean finished; 

























































































/* BAZ 1 执行 的 代码 */ 

> As 

y = 4711; 

finished = true; 

/* 到 这 里 线程 1 会 进入 休眠 状态 */ 


/* 线 程 2 执行 的 代码 */ 

if (finished) { 
System.err.println (x): 
System.err.println(y); 


} 

按照 旧版 的 内 存 模型 ， 上 面 的 代码 会 打印 出 17， 但 未 必 会 打印 4711 ， 一 旦 线程 2 被 唤醒 ， 
这 个 结果 与 volatitle 关键 字 的 语义 有 关 。 虽 然 volatitle 关键 字 有 明确 的 定义 , 但 与 非 
volatitle 变量 的 读 写 操作 却 无 关 。 对 那些 常年 与 底层 硬件 打交道 的 程序 员 来 说 ， 这 没什么 可 
惊讶 的 , 但 大 多 数 Java 程序 员 可 能 认为 ， 对 变量 finished 的 赋值 操作 应 该 会 将 其 之 前 的 赋值 
操作 都 刷 入 到 内 存 中 , 其 中 包括 非 volatitle 变量 y。 新 的 内 存 模型 强制 使 用 了 更 加 严格 的 内 
存 屏 障 来 限制 对 volatitle 变量 和 非 volatitle 变量 的 优化 行为 。 

之 前 提 到 的 无 限 循环 的 那个 例子 中 ，JIT 编译 需 可 能 会 为 非 volatitle 变量 在 每 个 线程 中 创 

建 一 份 局 部 副本 。 
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考虑 下 面 的 代码 : 


int operation(Item a, Item b) { 
return (a.value + b.value) * a.value; 


} 
编译 器 可 能 会 将 上 面 的 代码 优化 为 下 面 的 样子 : 


int operation(Item a, Item b) { 
int tmp = a.value; 
return (tmp + b.value) * tmp; 


} 
注意 , 上 面 的 代码 中 , 两 次 访问 a. value 的 操作 被 合并 为 一 次 操作 。 在 不 同 的 CPU FSE, 
这 种 优化 方式 所 带 来 的 性 能 提升 不 尽 相 同 。 但 是 ， 对 JIT 编译 器 来 说 ， 尽 可 能 减少 从 内 存 载 人 数 
据 的 操作 肯定 是 有 好 处 的 , 因为 访问 内 存 会 比 访问 寄存 器 慢 上 几 个 数量 级 。 静 态 编 译 语 言 几乎 都 
会 做 这 种 优化 ， 相 比 之 下 ， 若 是 无 法 在 Java 中 做 这 类 优化 的 话 ， 会 带 来 较 大 的 性 能 损耗 。 
原始 的 Java 内 存 模型 存在 缺陷 , 因此 若 编 译 器 不 能 证 明 变 量 a 和 变量 b 是 同一 个 对 象 的 话 ， 
就 不 一 定 会 执行 上 述 优化 。 幸 运 的 是 , 新 版 的 Java 内 存 模型 中 指定 了 只 要 定义 属性 value 时 没 
有 附加 volatitle 关键 字 ， 就 可 以 执行 上 述 优化 。 新 版 的 内 存 模型 允许 线程 为 非 volatile 变 
量 保 存 线程 内 副本 ， 这 也 说 明了 前 面 小 节 中 的 示例 代码 为 什么 可 能 会 产生 无 限 循 环 。 
o 不 变性 
旧版 Java 内 存 模型 的 一 大 问题 是 ， 在 某 些 情况 下 ， 被 声明 为 final (不 变性 ) 的 变量 的 值 
会 发 生变 化 。 按照 定义 来 说 ,被 声明 为 final 的 变量 因 其 不 变性 本 来 是 不 需要 使 用 同步 操作 的 ， 
但 在 旧版 内 存 模型 中 ， 却 不 是 这 样 。 在 Java 中 ， 对 被 声明 为 final 的 成 员 变 量 的 赋值 只 能 在 构 
造 函 数 中 进行 , 并 且 只 能 赋值 一 次 , 但 在 构造 函数 运行 之 前 ,未 初始 化 的 成 员 变 量 会 有 一 个 默认 
值 ， 可 以 是 0 或 者 null. 在 旧版 内 存 模型 中 ， 如 果 不 显 式 使 用 同步 操作 的 话 ， 其 他 的 线程 可 能 
在 执行 赋值 操作 将 值 提交 到 内 存 之 前 临时 看 到 这 个 默认 值 。 
上 述 问题 的 典型 事例 就 是 String 对 象 的 使 用 。string 类 中 所 有 成 员 变 量 都 是 加 了 final 
声明 的 ， 因 此 保证 了 String 的 实例 是 不 可 变 对 象 。 此 外 ， 为 节省 内 存 占用 ， 多 个 string WR 
可 能 会 使 用 一 个 共享 字符 数组 char 来 保存 具体 字符 ,并 使 用 起 始 偏 移 位 置 和 长 度 来 定位 具体 的 
FP, Mu, FIF cat (offset X 5) 和 字符 串 housecat (offset 为 0 ) 共享 同一 个 字符 数 
组 ， 按 照旧 版 内 存 模 型 ， 在 字符 串 cat 对 象 的 构造 函数 执行 之 前 ， 其 起 始 偏 移 位 置 offset 字段 
和 长 度 Length 字段 ( 默认 值 均 为 0 ) 可 能 会 被 其 他 线程 看 到 ， 使 其 认为 该 字符 串 对 象 的 内 容 是 
housecat (offset 为 0 )。 当 构造 函数 执行 结束 后 , 该 字符 串 对 象 的 内 容 又 会 被 解读 为 cat (offset 
为 5 )。 从 实际 效果 看 ， 这 违反 了 “字符 串 是 不 可 变 的 ”这 一 原则 。 
新 版 本 的 内 存 模 型 修复 了 这 个 问题 , 声明 为 final 的 成 员 变 量 无 须 使 用 同步 操作 就 可 以 保证 
不 变性 。 但 需要 注意 的 是 ， 即 便 是 使 用 final 关键 字 来 声明 成 员 变 量 , 但 如 果 在 构造 函数 完成 
之 前 就 将 该 成 员 变 量 暴 露 给 其 他 线程 的 话 ( this 引用 ), 仍然 可 能 会 出 现 上 述 问 题 。 
2. JSR-133 
重新 设计 Java 内 存 模型 是 由 JCP (Java comunity process ) 组 织 完成 的 ， 具 体内 容 在 JSR133 
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中 ,并 在 2004 年 发 布 的 Java 1.5 中 成 为 Sun 公司 的 参考 实现 ,JSR 以 及 开 S 本 身 的 内 容 都 挺 复 杂 , 
充满 了 精确 的 、 形 式 化 的 描述 内 容 。 对 JSR-133 的 详细 介绍 超出 了 本 书 的 范畴 ， 如 果 读 者 想 要 进 
一 步 提升 自己 的 编程 水 平 ， 详 细 研 读 一 下 相关 内 容 是 很 有 帮助 的 。 


| 网 上 有 一 些 不 错 的 解读 JSR-133 的 资料 , 例如 由 Jeremy Manson 和 Brian Goetz | 





编写 的 JSR-133 FAQ, VAA% Brian Goetz 编写 的 Fixing the Java memory Model. 





JSR-133 解决 了 volatitle 重 排 序 的 问题 , 明确 了 final 关键 字 的 语义 , 保证 了 其 不 变性 ， 
还 修复 了 一 些 从 JDK1.0 到 JDK 1.4 始终 存在 的 可 见 性 问题 .volatitle 的 语义 更 严格 , 相应 地 ， 
执行 效率 略 有 下 降 。 

对 于 Java 来 说 ，JSR-133 和 新 版 的 内 存 模型 是 一 大 进步 ， 同 步 的 语义 更 简单 ， 更 直观 ， 直 接 
使 用 volatitle 关键 字 就 可 以 实现 简单 的 同步 访问 。 当 然 ， 在 多 线程 环境 下 ， 即 便 是 有 了 新 版 
的 内 存 模型 ,操作 内 存 仍然 可 能 会 出 现 各 种 问题 , 但 因 语 义 不 明 而 导致 的 不 可 预测 性 问题 已 经 一 
去 不 复 返 了 。 因 此 ,谨慎 使 用 同步 机 制 ， 深 入 理解 锁 和 volatit1le 就 能 生产 出 优质 代码 。 












































4.3.2 同步 的 实现 


下 面 的 内 容 将 介绍 Java FA JVM 中 是 如 何 实现 同步 的 。 
1. 原生 机 制 

从 计算 机 最 底层 CPU 结构 来 说 ， 同 步 是 使 用 原子 指令 实现 的 ， 各 个 平台 的 具体 实现 可 能 
所 不 同 。 以 x86 平台 为 例 ， 它 使 用 了 专门 的 锁 前 缀 (lock prefix ) 来 实现 多 处 理 器 环境 中 指令 的 
原子 性 。 

在 大 多 数 CPU 架构 中 ， 标 准 指令 〈 例如 加 法 和 减法 指令 ) 都 可 以 实现 为 原子 指令 。 

为 了 实现 原子 的 条 件 的 载 和 信和 存储 数据 , 另 一 个 常用 的 方案 是 比较 -交换 ( compare-exchange ) 
指令 。 比 较 -交换 指令 会 对 内 存 中 指定 位 置 的 值 和 一 个 输入 值 做 比较 ， 如 果 相 同 ， 则 将 第 二 个 输 
和 信 值 写 入 到 内 存 的 指定 位 置 。 通 过 比较 -交换 指令 ， 如 果 交 换 成 功 的 话 ， 可 以 将 旧 的 内 存 内 容 写 
人 到 目标 操作 数 中 ， 或 是 设置 条 件 标 记 。 因 此 ， 比 较 - 交 换 指令 可 以 用 于 实现 分 支 执行 。 此 外 ， 
在 后 文中 还 会 讲 到 ， 比 较 - 交 换 指令 可 作为 实现 锁 的 基础 组 件 。 

此 外 , 内存 屏障 (memory fence ) 指令 也 可 用 来 保证 所 有 的 CPU 都 可 以 看 到 对 内 存 中 数据 的 
最 新 修改 ， 因 此 可 用 来 实现 volatitle 关键 字 的 语义 。 编 译 器 会 在 每 个 对 volatitle 变量 赋 
值 的 语句 后 面 ， 插 和 人 一 条 内 存 屏 障 指令 ， 以 便 其 他 的 CPU 可 以 看 到 本 次 修改 。 

内 存 屏障 强制 执行 内 存 有 序 ， 使 CPU 缓存 失效 ， 无 法 并 行 执行 指令 ， 因 此 使 用 原子 指令 是 
有 性 能 损耗 的 ， 即 使 原子 指令 是 实现 同步 的 基础 ， 在 使 用 的 时 候 也 需要 多 加 小 心 。 

对 调用 原子 指令 的 常用 优化 是 将 之 作为 JVM 的 内 建 函 数 (intrinsic call) 使 用 ， 例 如 ， 当 运 
行 时 发 现 调用 了 java.util.concurrent .atomic 包 中 革 些 函数 , 可 以 将 之 简单 地 实现 为 内 联 
的 汇编 指令 。 以 下 面 的 代码 为 例 : 
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import java.util.concurrent.atomic.*; 


public class AtomicAdder { 
AtomicInteger counter = new AtomicInteger (17); 


public int add() { 
return counter.incrementAndGet (); 
} 
} 


public class AtomicAdder { 
int counter = 17; 


public int add() { 
synchronized(this) { 
return ++counter; 
} 
} 
} 


在 第 一 个 Atomicadder 类 中 ， 如 果 运 行 时 能 够 识别 出 aaa 方法 的 具体 功能 ， 就 无 须 关 心 
AtomicInteger.incrementAndGet 方法 的 具体 实现 , 在 生成 代码 时 直接 插入 原子 的 加 法 指令 
即 可 。 之 所 以 可 以 使 用 这 种 优化 方法 , 是 因为 java.util.concurrent .AtomicInteget 类 是 
JDK 的 一 部 分 ， 具有 良好 的 语义 定义 。 如 果 没 有 原子 指令 的 话 ， 虽 然 可 以 实现 相同 的 功能 ,但 会 
更 麻烦 一 些 。 

实践 中 , 使 用 同步 操作 可 以 实现 排他 性 访问 , 但 失去 并 行 性 会 带 来 不 小 的 性 能 损耗 。 除了 一 
次 只 有 一 个 线程 可 以 访问 临界 区 之 外 ， 同 步 操作 本 身 也 会 带 来 性 能 损耗 。 

在 微 架 构 (micro-architecture ) 层面 ， 原 子 指令 的 执行 方式 在 各 个 平台 上 不 尽 相 同 。 一 般 情 
况 下 ， 它 会 暂停 CPU 流水 线 的 指令 分 派 ， 直 到 所 有 已 有 的 指令 都 完成 执行 ， 并 将 操作 结果 刷 入 
到 内 存 中 。 此 外 ， 该 CPU 还 会 阻止 其 他 CPU 对 相关 缓存 行 的 访问 ， 直 到 该 原子 指令 结束 执行 。 
在 现代 x86 硬件 平台 上 ， 如 果 屏 障 指令 (fence instruction) 中 断 了 比较 复杂 的 指令 执行 ， 则 该 原 
子 指令 可 能 需要 等 上 很 多 个 时 钟 周 期 才能 完成 执行 。 因 此 , 不仅 是 过 多 的 临界 区 会 影响 系统 性 能 ， 
锁 的 具体 实现 也 会 影响 性 能 , 当 频 繁 对 较 小 的 临界 区 执行 加 锁 、 解 锁 操 作 时 , 性 能 损耗 更 是 巨大 。 

2. 锁 

虽然 操作 系统 提供 了 同步 机 制 ， 实 现 锁 的 时 候 根 据 业务 需要 调用 操作 系统 的 具体 函数 即 可 ， 
包括 将 未 得 到 锁 的 线程 放 入 等 待 队列 。 但 这 种 通用 的 方式 并 不 理想 。 

如 果 某 个 锁 从 未 有 萝 争 出 现 ， 而 且 加 锁 的 次 数 也 非常 有 限 ， 而 某 个 锁 的 竞争 非常 激烈 ,这 两 
种 情况 下 如 何 处 理 ? 这 是 自 适应 运行 时 的 又 一 个 用 武之 地 。 在 介绍 自 适应 运行 时 如 何 根据 反馈 信 
息 选 择 锁 实 现 之 前 ， 这 里 需要 先 介绍 两 种 基本 锁 实 现 ， 胖 锁 ( fat lock ) 和 瘦 锁 ( thin lock )。 

瘦 锁 通常 用 于 锁 的 持 有 时 间 很 短 的 场景 中 , 胖 锁 则 用 于 更 复杂 一 些 的 场景 中 。 运行 时 可 以 根 
据 锁 的 竞争 情况 ， 在 两 种 类 型 之 间 做 切换 。 

o Ri 

自 旋 锁 ( spinlock ) 是 瘦 锁 的 最 简 实 现 。 当 线程 无 法 获取 到 锁 监 视 器 对 象 时 ， 该 线程 将 进入 
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循环 ， 重 复 执行 下 一 次 获取 监视 器 对 象 的 操作 。 一 般 情况 下 ， 自 旋 锁 使 用 原子 的 比较 -交换 指令 
来 实现 排他 性 写 操 作 ， 如 果 无 法 获取 到 锁 ， 则 重复 执行 比较 -交换 指令 。 

下 面 的 代码 是 一 个 非常 简单 的 自 旋 锁 实 现 。 

public class PseudoSpinlock { 


private static final int LOCK_FREE = 0; 
private static final int LOCK_TAKEN = 1; 











// 表 示 锁 的 状态 ， 被 释放 或 是 被 持 有 


static int lock; 
/ * 


尝试 将 锁 状 态 修改 为 
LOCK_TAKEN. 





cmpxchg 返回 锁 状 态 的 旧 值 

如 果 已 经 获取 到 了 锁 ， 则 该 操作 是 空 操作 
* 若 设置 锁 状 态 失败 ， 则 自选 等 待 

*/ 

public void lock() { 

//burn cycles, or do a yield 


* 
大 
* 
* 
* 
* 


while (cmpxchg(LOCK_TAKEN, [lock]) == LOCK_TAKEN) ; 
} 
[** 
* 尝 试 将 锁 状 态 设 置 为 LOCK_FREE 
A 


public void unlock() { 
int old = cmpxchg(LOCK_FREE, [lock]); 
// 避 免 递 归 加 锁 ， 例 如 同一 个 锁 加 锁 两 次 
assert (old == LOCK_TAKEN) ; 
} 
} 


自 旋 锁 实现 简单 ,进入 成 本 低 , 但 维持 自 旋 状态 却 代 价 高 晶 ， 因 此 自 旋 锁 只 适用 于 锁 的 持 有 
时 间 非 常 短 的 场景 。 自 旋 锁 并 不 适用 于 竞争 激烈 的 场景 ， 和 否则 大 部 分 时 间 都 会 被 浪费 在 循环 中 。 
此 外 ， 频 繁 调用 cmpxchg 指令 的 开销 也 不 小 ， 它 会 使 CPU 缓存 失效 ， 影 响 程序 的 并 行 性 。 

之 所 以 说 自 旋 锁 是 瘦 锁 , 是 因为 它 实现 简单 ,而且 在 没什么 竞争 的 场景 下 不 会 带 来 太 多 性 能 
损耗 。 在 较 少 干扰 的 场景 ， 使 用 自 旋 锁 可 以 实现 复杂 一 点 的 功能 ， 例 如 为 自 旋 功 锁 加 上 属性 或 
CPU 暂停， 但 基本 原理 是 一 致 的 。 

由 于 自 旋 锁 只 包含 循环 中 的 原子 检查 ,无 法 满足 Java 对 同步 的 要 求 , 例如 ， 当 调用 wait 方 
法 或 notify 方法 时 , 需要 与 系统 中 的 其 他 线程 通信 , 使 其 挂 起 或 恢复 工作 ， 而 这 无 法 通过 自 旋 
锁 完 成 。 

o 胖 锁 

相 比 于 瘦 锁 ， 胖 锁 在 获取 或 释放 时 会 慢 上 几 个 数量 级 ,可 以 表达 更 复杂 的 含义 ,并 且 在 竞争 
激烈 的 场景 下 仍 提供 良好 的 性 能 。 例如 , 胖 锁 的 实现 可 能 会 回 退 到 操作 系统 层面 的 锁 机 制 和 线程 
控制 机 制 。 






























































94 4% 线程 与 同步 





等 待 获取 锁 时 ， 线 程 会 被 挂 起 ， 放 入 到 由 该 胖 锁 维护 的 锁 队 列 Clock queue) 中 。 锁 队列 中 
线程 通常 是 按照 先入 先 出 ( first-in-first-out，FIFO ) 的 顺序 恢复 执行 ， 但 运行 时 也 可 能 会 按照 线 
程 的 优先 级 来 重新 调度 。 对 监视 器 对 象 来 说 ，JVM 还 会 维护 一 个 等 待 队列 ( wait queue )， 用 于 保 
存 那 些 调 用 了 wait 方法 的 线程 , 当 调用 notify 方法 时 , 会 从 该 队列 中 拿 出 一 个 线程 恢复 执行 。 

@ 公平 性 

就 线程 调度 来 说 ,公平 性 (fairness ) 是 指 为 每 个 线程 安排 同等 执行 时 间 的 调度 策略 。 如 果 某 
个 线程 用 完了 其 时 间 片 ， 就 轮 到 另 一 个 线程 执行 。 

如 果 不 关心 公平 性 的 话 ， 例 如 当 不 需要 平衡 各 个 CPU 核心 的 使 用 率 ， 而 且 各 个 线程 执行 相 
同 的 任务 时 , 通常 情况 下 , 使 让 正在 运行 的 线程 继续 执行 下 去 可 以 提升 整体 性 能 。 简单 来 说 就 是 ， 
如 果 只 关心 应 用 程序 的 吞吐 量 的 话 , 让 刚刚 释放 锁 的 线程 重新 获取 锁 是 个 不 错 的 办 法 ,因为 这 样 
可 以 避免 上 下 文 切 换 ， 也 不 会 使 CPU 缓存 失效 。 事 实 上 ， 这 种 不 公平 的 调度 策略 的 确 可 以 提升 
执行 效率 。 

从 设计 上 讲 ， 瘦 锁 不 涉及 公平 性 ， 当 试图 获取 锁 时 ， 相 关 线 程 需 要 再 竞争 一 次 。 

胖 锁 与 之 类 似 , 锁 队 列 是 有 序 的 , 但 如 果 同 时 有 多 个 线程 被 唤醒 , 那么 仍旧 需要 再 竞争 一 次 。 

e JRockit 中 的 锁 字 

之 前 曾经 介绍 过 ，JRockit 中 每 个 对 象 的 头 部 都 有 2 个 32 位 的 标记 字 (mark word )， 其 中 一 个 
是 指向 对 象 类 型 信息 的 类 块 ， 另 一 个 则 包含 了 锁 和 垃圾 回收 的 信息 (8 位 为 垃圾 回收 ，24 位 为 锁 )。 





























































































































本 节 介 绍 的 锁 字 和 对 象 头 的 布局 是 基于 JRockit R28 版 本 的 实现 ， 在 将 来 的 
一 发 行 版 本 中 可 能 会 做 改变 ， 在 此 只 是 为 了 帮助 说 明 锁 的 状态 和 实现 。 








在 JRockit 中 ， 当 首次 使 用 某 个 锁 时 ， 默 认 将 之 作为 瘦 锁 对 待 。 瘦 锁 对 象 中 的 位 信息 包含 了 
持 有 该 锁 的 线程 ,以 及 与 优化 相关 的 一 些 额外 的 信息 ,例如 会 记录 该 锁 在 不 同 线程 间 的 传递 次 数 ， 
用 于 判断 该 锁 是 否 在 大 部 分 时 间 只 在 某 个 线程 内 用 到 。 

使 用 胖 锁 时 ， 则 需要 为 该 锁 以 及 信号 量 队 列 分 配 一 个 JVM 内 部 的 监视 器 ,因此 , 在 胖 锁 中 ， 
锁 字 的 大 部 分 空间 用 来 存储 监视 器 的 索引 。 























胖 锁 8 位 垃圾 回收 21 位 监视 器 索引 EEN 
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瘦 锁 14 位 持 有 锁 的 线程 的 ID 
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上 图 只 是 JRockit 里 锁 字 的 布局 ， 展 示 了 用 于 实现 胖 锁 和 瘦 锁 的 辅助 数据 结构 ， 不 同 的 虚拟 
机 厂商 通常 有 各 自 的 实现 ,下面 的 状态 图 展示 了 胖 锁 和 瘦 锁 的 相互 转换 ,以 及 锁 字 在 状态 转换 中 
的 作用 。 
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分 配 新 对 象 


解锁 Tl 


持 有 锁 的 线 
程 的 ID :TI1 


上 图 展示 了 瘦 锁 在 加 锁 和 未 加 锁 两 种 状态 间 的 转换 。 当 线程 T1 在 茶 个 对 象 上 加 锁 成 功 后 ， 
j 象 头 中 的 锁 字 会 记录 下 该 线程 的 DD 值 ,并 将 该 对 象 标记 为 使 用 了 瘦 锁 。 当 线程 T1 释放 掉 锁 时 ， 
象 将 恢复 到 未 加 锁 状 态 ， 清 空 锁 的 持 有 者 标记 位 。 











x 





pI 


分 配 新 对 象 


监视 器 M 


未 加 锁 
已 加 锁 





才 有 锁 的 线程 的 ID T1 监视 器 M 


由 于 调用 wait; 
方法 而 膨胀 | 











但 当 涉及 胖 锁 时 ， 事 情 会 复杂 一 些 。 当 运行 时 发 现 某 个 锁 的 竞争 非常 激烈 ， 或 者 调用 了 类 似 
wait 的 方法 时 ， 会 将 瘦 锁 膨胀 为 胖 锁 。 如 果 已 知 某 个 锁 的 竞争 非常 激烈 ， 则 当 线 程 T1 试图 获取 
锁 时 ， 会 直接 使 用 胖 锁 ， 此 外 ,在 调用 wait 方法 时 ,也 含有 从 瘦 锁 转换 为 胖 锁 的 执行 路 径 。 由 
于 胖 锁 的 锁 字 中 包含 了 JVM 内 部 监视 咒 的 索引 ， 所 以 在 将 胖 锁 转换 为 瘦 锁 之 前 就 执行 释放 锁 的 
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操作 ， 会 在 锁 字 中 留 下 监视 器 的 索引 ID ， 以 便 重用 监视 器 对 象 ， 如 上 图 所 示 。 
4.5 节 会 详细 介绍 运行 时 根据 竞争 情况 来 转换 首 锁 和 胖 锁 的 场景 。 


4.3.3 同步 在 字 节 码 中 的 实现 


Java 字 节 人 码 中 有 两 条 用 于 实现 同步 的 指令 ,分 别 是 monitorenter 和 monitorexit, 它们 
都 会 从 执行 栈 中 弹出 一 个 对 象 作为 其 操作 数 。 使 用 javac 编译 源 代码 时 ， 若 遇 到 显 式 使 用 监视 
右 对 象 的 同步 代码 ， 则 为 之 生成 相应 的 monitorenter 指令 和 monitorexit 指令 。 以 下 面 的 
代码 为 例 ， 作 为 一 个 实例 方法 ， 其 使 用 了 隐 式 的 监视 器 对 象 this. 


public synchronized int multiply(int something) { 
return something * this.somethingElse; 












































} 
上 面 的 代码 会 编译 为 如 下 形式 。 


public synchronized int multiply(int); 
Code: 
0: iload_1 
1: aload 0 
2: getfield #2; // 获 取 实 例 属性 somethingElse 的 值 
5: imul 
6 ireturn 

















在 这 里 , 运行 时 或 JIT 编译 器 , 会 在 .class 文件 检查 该 访问 的 访问 标志 集合 (access flag set ), 
以 此 来 判断 该 方法 是 否 为 同步 方法 。 实例 方 法 可 以 将 当前 对 象 作为 隐 式 监视 器 , 静态 方法 则 可 以 
将 当前 类 的 类 对 象 作 为 隐 式 监视 器 。 因 此 ， 上 面 的 代码 有 如 下 的 等 价 形式 。 
public int multiply(int something) { 
synchronized(this) { 
return something * this.somethingElse; 


} 
} 


但 上 面 的 代码 ， 在 编译 之 后 会 稍微 复杂 一 些 。 


public int multiply(int); 





Code: 
0: aload 0 
1 dup 
2 astore_2 
3 monitorenter 
4: iload_1 
5 aload_0 
6: getfield #2; // 获 取 实 例 属性 somethingElse 的 值 
9: imul 


10: aload_2 
11: monitorexit 
12: ireturn 
13: astore_3 
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14: aload_2 
15: monitorexit 
16: aload_3 
17: athrow 
Exception table: 
from to target type 
4 12 13 any 
13 16 13 any 


在 上 面 的 示例 代码 中 ， javac 除了 生成 monitorenter 指令 和 monitorexit 指令 外 ， 还 
将 synchronized 代码 块 置 于 try. . .catch 代码 块 中 (从 字 节 码 偏 移 位 置 4 到 偏 移 位 置 9 )。 
当 发 生 异 常 时 ， 控 制 流转 到 catch 代码 块 ( 即 偏 移 位置 13 处 ) 继续 执行 ,会 在 抛 出 所 捕获 的 异 
常 之 前 先 释放 已 持 有 的 锁 。 

之 所 以 编译 器 会 如 此 处 理 代 码 ， 是 为 了 保证 即使 synchronized 代码 块 发 生 异常 ， 代 码 也 
能 够 正确 释放 掉 锁 。 此 外 ， 注 意 一 下 异常 表 中 的 内 容 ， 假 设 catch 代码 块 中 发 生 了 异常 ， 仍 会 
跳 转 到 自身 catch 块 中 处 理 , 形成 循环 , 只 不 过 这 种 处 理 方式 在 Java 源 代 码 中 是 不 可 能 出 现 的 。 
参见 第 2 章 中 对 这 个 问题 的 阐述 。 

对 于 上 述 的 catch 块 的 结构 , 一般 是 作为 非 结 构 化 控制 流 处 理 的 ,但 作为 一 种 递归 的 catch 
结构 ， 它 会 增加 控制 流 分 析 的 复杂 性 ， 因 此 在 JRcokit 中 ， 编 译 器 会 对 其 做 特殊 处 理 ， 和 否则 就 会 
为 代码 太 复杂 而 使 很 多 优化 策略 无 法 应 用 。 

在 JRockit 内 部 处 理 处 理 方法 时 ,会 执行 与 上 面 的 示例 代码 相似 的 处 理 ， 将 隐 式 监视 器 转化 
为 显 式 监视 器 ， 以 避免 使 用 同步 标志 的 特殊 情况 。 

锁 匹 配 

字 节 人 码 中 除了 对 隐 式 监视 器 的 转换 外 , 还 存在 着 一 个 更 严重 的 问题 , 就 是 monitorenter 指令 

和 monitorexit 指令 可 能 不 匹配 ， 例 如 可 以 在 字 节 码 中 对 一 个 未 加 锁 的 对 象 执行 monitorexit 
指令 ， 而 该 指令 在 执行 时 会 抛 出 Tl1legalMonitorstateException 异常 。 此 外 , WUE 
码 中 一 个 方法 内 对 某 个 对 象 加 锁 ， 却 在 另 一 个 方法 内 释放 该 锁 。 同 样 的 问题 还 有 ， 在 同一 个 对 
象 上 重复 执行 的 monitorenter 指令 和 monitorexit 指令 有 可 能 不 是 正确 配对 的 。 这 些 字 节 
码 结构 在 Java 中 都 是 不 合法 的 ， 但 在 字 节 码 中 都 是 合法 的 ， 而 实际 运行 的 时 候 又 会 使 运行 时 抛 
出 异常 。 

出 于 性 能 方面 的 考虑 ，JIT 编译 器 需要 能 辨识 出 加 锁 和 解锁 操作 是 否 匹 配 。 锁 的 类 型 决定 了 
是 否 需 要 执行 解锁 操作 ， 这 点 非常 重要 ， 尤 其 是 当 不 只 有 胖 锁 和 瘦 锁 两 种 类 型 时 。 但 不 幸 的 是 ， 
由 于 字 节 码 和 Java 源 代 码 的 语义 不 完全 相同 ， 所 以 虚拟 机 不 能 假设 字 节 码 中 的 锁 操 作 都 是 正确 
匹配 的 ， 而 且 不 匹配 的 锁 操 作 确实 可 能 存在 ， 因 此 JRockit 必须 能 够 正确 处 理 这 种 不 匹配 的 锁 操 
作 代 码 。 

JRockit 代码 生成 器 会 在 生成 代码 时 执行 控制 流 分 析 ， 将 monitorenter 指令 和 monitorexit 
指令 相 匹 配 ， 对 于 由 Java 源 代码 编译 而 得 的 字 节 码 来 说 ， 是 可 以 完成 匹配 的 (在 catch 块 中 捕 
获 同 步 块 代码 抛 出 的 异常 并 释放 锁 ， 可 以 看 作 是 一 种 特例 )。 匹 配 工作 是 在 将 基于 栈 的 代码 转换 
为 基于 寄存 器 的 代码 过 程 中 完成 的 ， 即 在 BC2HIR 阶段 执行 控制 流 分 析 时 完成 。 
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JRockit 使 用 名 为 锁 符 号 Clock token ) 的 机 制 来 判断 哪 两 条 monitorenter 指令 和 monitorexit 
指令 应 该 匹配 在 一 起 。 每 条 monitorenter 指令 都 会 被 转换 为 一 个 带 有 目的 锁 符 号 的 指令 , 与 
之 相 匹配 的 monitorexit 指令 则 会 转换 为 使 用 该 目的 锁 符号 作为 源 操作 数 的 指令 。 

下 面 的 伪 代 码 展示 了 Java 中 的 同步 是 如 何 转换 为 JRockit 中 相 匹 配 的 锁 操 作 的 。 


synchronized(s) { token = monitorEnter(o); 
fool); ==> fool 
} monitorExit(token); 


特殊 情况 下 ， 可 能 会 出 现存 在 monitorenter 指令 ， 却 没有 与 之 匹配 的 monitorexit 4 
令 的 情况 ,JRockit 将 这 种 指令 标记 为 未 匹配 的 (unmatched )。 尽 管 运行 时 可 以 支持 这 种 情况 ， 而 
且 这 样 符合 字 节 码 规范 ， 但 运行 时 处 理 这 种 不 匹配 的 锁 操 作 时 会 比 正常 情况 下 慢 上 几 个 数量 级 ， 
后 续 将 会 对 此 做 详细 介绍 。 
事实 上 ,正常 编译 的 字 节 码 中 不 会 锁 操 作 不 匹配 的 情况 ， 但 在 经 过 混淆 的 代码 中 ， 或 者 经 过 字 
节 码 分 析 器 处 理 过 的 字 节 码 中 可 能 会 出 现 这 种 极端 情况 。 运 行 JRockit 时 ， 指 定 -Xverbose:codegen 
参数 可 以 让 代码 生成 器 打印 出 检测 到 了 哪些 不 匹配 的 锁 。 在 JRockit R28 版 本 中 ，JRockit Flight 
Recorder 套件 使 用 了 专门 的 事件 来 记录 检测 到 了 不 匹配 的 锁 ， 可 作为 性 能 分 析 的 一 个 指标 。 如 果 
应 用 程序 代码 中 出 现 了 不 匹配 的 锁 ， 其 所 带 来 的 恶劣 影响 会 完全 抵消 掉 之 前 做 的 性 能 优化 , 因此 
要 将 之 解决 。 

当 涉 及 本 地 代码 时 ,根本 无 法 完成 锁 操 作 的 配对 工作 。 以 JNI 的 方式 从 本 地 代码 中 执行 同步 
操作 时 ， 由 于 运行 时 无 法 控制 本 地 代码 的 执行 栈 ， 所 以 会 将 之 作为 不 匹配 的 锁 来 处 理 。 在 JNI 中 
通过 存根 代码 来 操作 锁 的 开销 比 没有 锁 的 情况 会 慢 上 几 个 数量 级 。 所 以 , 如 果 应 用 程序 需要 频繁 
调用 本 地 代码 ， 而 其 中 又 涉及 同步 操作 ， 那 就 很 难 会 有 好 的 执行 性 能 了 。 

那么 ， 什 么 是 锁 符 号 呢 ? 在 JRockit 中 ， 锁 符号 是 指向 监视 融 对 象 (monitorenter 指令 的 
操作 数 ) 的 引用 ,并 额外 附加 了 几 个 二 进 制 位 记录 相关 信息 。 正 如 在 第 3 章 中 介绍 的 ， 对 象 一 般 
都 是 以 偶数 地 址 对 齐 的 ， 从 实践 来 看 ， 是 按 8 字 节 对 齐 ( 如 果 是 对 更 大 的 堆 执行 引用 压缩 的 话 ， 
可 能 会 按 更 大 的 字 节 数 对 齐 )， 因 此 锁 符 号 对 象 地 址 的 低位 被 用 来 存储 了 一 些 其 他 信息 。 以 对 象 
地 址 按 8 字 节 对 齐 为 例 , 如 果 对 象 地 址 的 低 3 位 不 是 0, 就 表示 JRockit 已 经 将 该 对 象 作为 监视 器 
使 用 了 ， 已 经 与 某 个 锁 符号 关联 起 来 了 。 非 0 的 低 三 位 可 以 表示 7 种 锁 信 息 ， 例 如 瘦 锁 、 胖 锁 、 
递归 地 使 用 同一 个 线程 、 不 匹配 的 锁 等 。 锁 符号 只 存在 于 局 部 栈 帧 中 ， 不 在 堆 中 ， 而 JRockit 并 
不 对 局 部 栈 帧 中 的 引用 执行 压缩 ， 所 以 锁 符 号 对 象 的 低 三 位 肯定 都 是 0， 可 以 通过 对 象 地 址 的 低 
位 获取 锁 相 关 信息 。 

之 前 的 章节 曾经 介绍 过 , 在 任意 时 间 , 活动 寄存 器 的 内 容 是 由 编译 器 来 显 式 指 定 的 ,作为 存 
活 对 象 图 供 代 码 生成 器 使 用 。 与 之 类 似 ， 锁 符号 也 是 这 样 的 。 

由 于 Java 源 代码 中 可 以 隐 式 使 用 监视 器 对 象 ， 因 此 若 在 其 中 扔 套 了 另 一 个 同步 代码 块 ， 则 
释放 隐 式 监视 器 对 象 的 操作 必须 要 放 在 释放 贬 套 锁 之 后 。 要 查看 存活 对 和 象 图 中 的 某 个 对 象 是 否 为 
锁 符 号 并 不 困难 ,但 想 按 顺 序 释放 锁 符 号 ， 就 需要 记录 一 些 般 套 信息 , 例如 当 发 生 异 常 时 ,运行 
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时 需要 知道 各 个 锁 的 髓 套 关 系 ， 这 部 分 信息 就 存储 在 存活 对 象 图 中 。 

对 于 那些 不 匹配 的 锁 来 说 , 释放 锁 时 为 了 能 够 找到 与 之 相 匹 配 的 加 锁 操作 , 束 必 须要 遍历 执 
行 栈 , 在 之 前 的 所 有 栈 帧 中 查找 对 应 的 加 锁 操 作 ， 并 更 新 锁 符 号 中 的 信息 。 这 个 操作 需要 暂停 所 
有 应 用 程序 线程 ， 比 处 理 匹配 的 锁 操 作 会 慢 上 几 个 数量 级 , 因为 处 理 正 确 匹配 的 锁 操 作 只 需要 修 
改 部 栈 帧 中 锁 符号 即 可 。 幸 好 ， 这 种 锁 操 作 不 匹配 的 情况 很 少见 ， 使 用 javac 编译 出 的 字 节 码 不 
会 出 现 这 种 情况 。 




















43.4 ”线程 的 实现 


本 节 将 会 简要 介绍 几 种 不 同 的 线程 实现 。 目 前 的 主流 实现 方式 是 直接 应 用 操作 系统 自身 的 
线程 。 

1. 绿色 线程 

绿色 线程 一 般 指 使 用 多 路 复 用 算法 ( multiplexing algorithm ) 实现 的 线程 ， 通 常会 用 一 个 
操作 系统 线程 对 应 JVM 的 多 个 或 所 有 Java 线程 。 这 样 ， 就 需要 由 运行 时 负责 调度 与 该 操作 系 
统 线程 对 应 的 所 有 Java 线程 。 使 用 绿色 线程 的 好 处 是 ， 在 处 理 线程 上 下 文 切换 和 创建 新 线程 
时 ， 其 执行 开销 会 比 操作 系统 线程 小 得 多 。 早 期 ， 在 很 多 JVM 实现 中 都 不 同 程度 地 使 用 了 绿 
色 线 程 。 

但 是 , 使 用 绿色 线程 会 增加 线程 调度 和 管理 生命 周期 的 复杂 度 ， 此外， 如 果 绿 色 线 程 调用 本 
地 代码 时 被 阻塞 住 ， 则 该 操作 系统 线程 所 对 应 的 所 有 Java 线程 都 会 被 挂 起 ， 这 很 有 可 能 会 导致 
死 锁 。 因 此 ， 使 用 绿色 线程 时 就 需要 有 相应 的 机 制 来 防止 这 种 情况 的 出 现 。JRockit 的 早期 版 本 
中 使 用 了 绿色 线程 ， 并 配 以 名 为 叛徒 线程 (renegade thread ) 的 机 制 来 解决 操作 系统 线程 挂 起 的 
问题 , 该 机 制 会 在 原 操作 系统 线程 执行 本 地 代码 时 , 创建 一 个 新 的 操作 系统 线程 来 执行 。 如 果 绿 
色 线 程 频繁 调用 本 地 代码 ， 那 么 最 终 会 变 成 Java 线程 和 操作 系统 线程 的 一 对 一 映射 模型 。 

o 多 对 多 映射 模型 

实现 绿色 线程 的 一 种 变通 方式 是 , 使 用 多 个 操作 系统 线程 轮流 执行 多 个 绿色 线程 的 任务 , 称 
为 多 对 多 映射 模型 (n x m thread model )， 这 样 可 以 在 某 种 程度 上 缓解 绿色 线程 在 执行 本 地 代码 
时 被 挂 起 而 可 能 导致 的 死 锁 问 题 。 

这 种 模型 很 适合 早期 的 Java 服务 器 端 程序 的 开发 ， 因 为 那 时 更 看 重 的 是 线程 的 扩展 性 和 局 
动 开 销 。JRockit 最 早 一 批 付 费用 户 的 需求 是 支持 大 量 线程 并 发 执行 ,并且 创建 线程 的 开销 要 低 ， 
典型 场景 是 用 于 网 络 聊天 室 的 服务 器 端 开 发 。 了 及 ockit 1.0 版 本 使 用 了 多 对 多 映射 模型 ， 在 这 种 场 
景 下 可 以 使 应 用 程序 性 能 大 幅 提升 。 

随 着 时 间 的 发 展 ，Java 应 用 程序 也 变 得 更 加 复杂 ,多 路 复 用 操作 系统 线程 的 复杂 度 增加 , 线 
程 执 行 本 地 代码 变 得 更 加 可 靠 ， 其 他 技术 (例如 同步 的 具体 实现 ) 不 断 进 步 ， 这些 都 使 多 对 多 映 
射 模型 愈 发 跟 不 上 时 代 的 发 展 。 

就 目前 来 看 ， 现 代 服 务 右 端的 JVM 实现 中 已 经 不 再 使 用 绿色 线程 ， 而 是 直接 将 Java 线程 映 
射 为 操作 系统 线程 来 执行 。 
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2. 操作 系统 线程 

自然 地 ,使 用 操作 系统 线程 ( 例如 类 Unix 系统 中 的 POSIX 线程 PRX java.lang.Thread 
类 的 实例 是 实现 线程 最 直观 的 方法 ， 即 所 谓 的 一 对 一 映射 模型 (one-to-one mapped )。 使 用 这 种 
映射 模型 的 好 处 是 两 种 线程 的 语义 基本 相同 ， 不 需要 做 太 多 额外 的 准备 工作 ， 线 程 的 调度 也 可 
以 交 给 操作 系统 完成 。 

就 目前 来 看 ， 所 有 现代 JVM 实现 都 使 用 了 这 种 方式 ， 其 他 实现 方式 都 通常 因 其 复杂 性 而 i 
弃 用 ,至 少 在 实现 服务 器 端 应 用 程序 方面 是 这 样 。 在 租 入 式 环境 中 , 使 用 其 他 方式 实现 线程 还 
可 行 的 ,但 同时 ， 这 种 环境 对 实现 者 的 其 他 限制 也 很 多 。 

o 线程 池 

如 果 虚 拟 机 中 线程 是 基于 操作 系统 线程 实现 的 ， 那么 就 可 以 使 用 一 些 原 本 不 太 适 用 的 技术 
了 ,例如 线程 池 。 创建 和 启动 操作 系统 线程 的 开销 远 比 操作 绿色 线程 大 ， 因 此 使 用 线程 池 可 以 大 
幅 提升 性 能 。 如 果 java .lang .Thread 的 实例 是 基于 操作 系统 线程 实现 的 , 那么 在 Java 程序 中 
重用 已 有 线程 ， 可 以 节省 不 少 执行 开销 ,例如 保持 有 个 线程 存在 ,每 次 有 新 任务 时 ， 取 出 一 个 
线程 来 执行 ， 无 须 每 次 都 创建 新 线程 。 我 们 认为 ， 不 要 自 以 为 比 JVM 聪明 ,但 也 取决 于 不 同情 
况 。 而 是 否 使 用 线程 池 ， 应 该 经 过 严谨 的 性 能 测试 之 后 ， 再 做 决定 。 

此 外 ， 如 果 Java 线程 不 是 纯粹 基于 操作 系统 线程 实现 的 ， 使 用 线程 池 可 能 会 适得其反 。 使 
用 绿色 线程 时 ， 线 程 的 启动 开销 非常 小 ， 尽 管 目前 JVM 实现 都 是 基于 操作 系统 线程 的 ， 但 既然 
Java 是 跨 平台 的 语言 ， 所 以 就 不 能 太 过 迷信 线程 池 ， 使 用 时 需 谨慎 。 
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44 对 于 线程 与 同步 的 优化 
本 节 将 会 介绍 自 适应 运行 时 环境 中 线程 和 同步 操作 方面 的 优化 。 


4.4.1 锁 膨 胀 与 锁 收 缩 


正如 之 前 介绍 锁 时 提 到 的 , 自 适 应 运行 时 系统 需要 根据 当前 系统 负载 和 线程 苋 争 情况 , 在 胖 
锁 和 瘦 锁 之 间 切 换 ， 这 里 就 涉及 代码 生成 器 和 刍 的 具体 实现 。 

在 自 适应 环境 中 可 以 得 到 锁 的 运行 信息 〈 如 果 要 做 完整 的 锁 分 析 则 会 有 一 些 性 能 开销 )， 当 
线程 获取 或 释放 某 个 锁 时 ， 运 行 时 系统 可 以 记录 下 是 哪个 线程 获得 了 锁 ， 获 取 锁 时 的 竞争 情况 。 
所 以 如 果 某 个 线程 尝试 了 很 多 次 还 无 法 获取 到 锁 ， 运行 时 就 可 以 考虑 将 该 瘦 锁 调整 为 胖 锁 。 胖 
锁 更 适合 竞争 激烈 的 场景 ， 挂 起 被 阻塞 住 的 线程 ， 不 再 让 其 自 旋 ， 这 样 可 以 节省 对 CPU 资源 的 
浪费 。 这 种 瘦 锁 到 胖 锁 的 转换 称 为 锁 膨 胀 ( lock inflation )。 
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默认 情况 下 ，JRockit 使 用 一 个 小 的 自 旋 锁 来 实现 刚 膨 胀 的 胖 锁 ， 只 持续 很 
短 的 时 间 。 竺 看 之 下 ,这 不 太 符 合 常理 ,但 这 么 做 确实 是 很 有 益处 的 。 如 果 锁 的 
是 人 竞争 确实 非常 激烈 ， 而 导致 线程 长 时 间 自 旋 的 话 ， 可 以 使 用 命令 行 参数 
> -XX:UseFatSpin=false 禁用 此 方式 。 作 为 胖 锁 的 一 部 分 ， 自 旋 锁 也 可 以 利用 
自 适 应 运行 时 获取 到 的 反馈 信息 , 这 部 分 功能 默认 是 禁用 的 ,可 以 使 用 命令 行 参 
数 -Xx:UseAdaptiveFatSpin=true 来 开启 。 


类 似 地 ,在 完成 了 一 系列 解锁 操作 之 后 ， 如 果 锁 队列 和 等 待 队 列 中 都 是 空 的 ， 这 时 就 可 以 考 
处 将 胖 锁 再 转换 为 瘦 锁 了 ， 这 称 为 锁 收 缩 (lock deflation )。 

JRockit 使 用 了 启发 式 算法 来 执行 锁 脱 胀 和 锁 收 缩 ， 因 此 对 于 某 个 应 用 程序 来 说 ， 锁 的 行为 
会 根据 线程 对 锁 的 竞争 情况 而 改变 。 

如 果 需 要 的 话 , 可 以 通过 命令 行 参数 来 改变 用 于 切换 胖 锁 和 瘦 锁 的 启发 式 算法 , 但 通常 不 建 
议 这 样 做 。 第 5 章 会 对 此 做 简要 介绍 。 

















4.4.2 ”递归 锁 


同一 个 线程 可 以 对 同一 个 对 象 加 锁 数 次 , 这 就 是 所 谓 的 递归 锁 ( recursive lock ), 尽管 没 必要 ， 
但 这 么 做 确实 是 合法 的 。 例 如， 当 某 个 会 执行 加 锁 操 作 的 方法 被 内 联 到 对 同一 个 对 象 加 锁 的 方法 
中 , 或 者 某 个 同步 方法 被 递归 调用 ,这 时 就 会 出 现 递 归 锁 。 如 果 临 界 区 代码 中 没有 危险 代码 ( 例 
如 在 内 部 锁 和 外 部 锁 之 间 访 问 volatile 变量 ， 或 发 生 对 象 逃 逸 )， 则 代码 生成 器 可 以 考虑 将 内 
部 的 锁 彻 底 移 除 。 

JRockit 使 用 了 一 个 专门 的 锁 符号 位 ( lock token bit ) 来 标识 递归 锁 。 当 某 个 锁 被 某 个 线程 获 
取 到 至 少 两 次 以 上 ， 而 且 没有 释放 最 外 层 的 锁 ， 则 该 锁 会 被 标记 为 递归 锁 。 当 发 生 异 常 时 ,运行 
时 会 重 置 递归 标记 ， 正 确 抛 出 异常 ， 不 会 带 来 什么 额外 的 同步 操作 的 开销 。 














4.4.3” 锁 融合 


在 JRockit F, JIT 优化 编译 器 还 使 用 了 一 种 名 为 锁 融 合 ( lock fusion ) 的 代码 优化 技术 ,在 
某 些 文档 中 也 称 为 锁 粗 化 (lock coarsening )。 当 编译 需 将 很 多 方法 内 联 到 一 起 后 ， 尤 其 是 多 个 同 
步 方 法 , 可 能 会 出 现 多 个 代码 块 按 顺序 对 同一 个 监视 器 对 象 重复 执行 加 锁 和 解锁 操作 , 这 种 场景 
下 可 以 应 用 锁 融 合 优化 。 

以 下 面 的 代码 为 例 : 

synchronized(x) { 


// BAT MLA 
} 




















// 执 行 一 些 短 代码 


x = Vr 
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synchronized(y) { 
/ / RAT HM Me HE 
} 


Faerie All AT (alias analysis ) 可 以 判断 出 x 和 y 实际 上 是 同一 个 对 象 。 如 果 两 个 同 
步 代 码 块 之 间 代 码 的 执行 开销 比 释放 锁 再 获取 锁 的 开销 还 小 的 话 , 则 代码 生成 器 就 可 以 考虑 将 两 
个 同步 代码 块 合并 到 一 起 ， 如 下 所 示 。 
synchronized(x) { 
/ /执行 业务 逻辑 
/ /执行 一 些 短 代码 
/ /执行 其 他 业务 逻辑 
} 


当然 ， 执 行 锁 融 合 的 前 提 是 两 个 同步 代码 块 之 间 的 代码 中 不 能 有 对 volatile 变量 的 访问 ， 
也 不 能 发 生 对 象 逃 逸 ， 更 不 能 使 融合 后 的 代码 违反 Java 内 存 模型 的 语义 。 除 了 上 述 问题 之 外 ， 
还 有 一 些 其 他 可 能 因 优 化 产生 的 问题 需要 处 理 ， 例 如 锁 融 合 后 对 异常 的 处 理 需 要 考虑 之 间 的 兼 
容 性 ， 因 其 超出 本 章 范 围 ， 这 里 不 再 歼 述 。 

将 所 有 的 代码 块 都 融合 到 一 起 显然 不 是 什么 好 主意 , 但 如 果 能 够 正确 挑选 必要 的 代码 块 融 
的 话 ， 还 是 很 有 神 益 的 。 如 果 能 获得 足够 多 的 采样 信息 ， 就 能 够 更 准确 地 判断 是 否 要 执行 锁 融 
操作 。 

总 归 一 句 话 ， 上 述 代码 优化 的 主要 目的 是 避免 不 必要 的 锁 释 放 操作 。 其 实 , 不 借助 代码 生成 
器 ， 线 程 系统 本 身 可 以 通过 状态 机 来 实现 类 似 的 优化 ， 即 所 谓 的 延迟 解锁 (lazy unlocking )。 
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44.4 延迟 解锁 


如 何 分 析 很 多 线程 局 部 的 解锁 , 以 及 重新 加 锁 的 操作 只 会 降低 程序 执行 效率 ” 这 是 否 是 程序 
运行 的 常态 ”运行 时 是 否 可 以 假设 每 个 单独 的 解锁 操作 实际 上 都 是 不 必要 的 ? 

如 果 某 个 锁 每 次 被 释放 后 又 立刻 都 被 同一 个 线程 获取 , 则 运行 时 可 以 做 上 述 假设 。 但 只 要 有 
另外 某 个 线程 试图 获取 这 个 看 起 来 像 是 未 被 加 锁 的 监视 器 对 象 ( 这 种 情况 是 符合 语义 的 )， 这 种 
假设 就 不 再 成 立 了 。 这 时 为 了 使 这 个 监视 器 对 象 看 起 来 像 是 一 切 正常 , 原本 持 有 该 监视 器 对 象 的 线 
程 需要 强行 释放 该 锁 。 这 种 实现 方式 称 为 延迟 解锁 ， 在 某 些 描述 中 也 称 为 偏向 锁 (biased locking )。 

即使 某 个 锁 完 全 没有 竞争 , 执行 加 锁 和 解锁 操作 的 开销 仍旧 比 什 么 都 不 做 要 大 。 而 使 用 原子 
指令 会 使 该 指令 周围 的 Java 代码 都 产生 额外 的 执行 开销 。 

在 Java 环境 中 ， 有 时 确实 可 以 假设 大 部 分 锁 都 只 在 线程 局 部 内 起 作用 。 第 三 方 库 的 作者 无 
法 知晓 其 代码 是 否 会 被 用 在 并 行 环境 中 , 除非 显 式 地 指定 代码 不 是 线程 安全 的 , 否则 为 了 完成 线 
程 局 部 内 的 操作 ， 就 不 得 不 使 用 不 必要 的 同步 操作 。JDK 本 身 也 有 很 多 这 样 的 例子 , 典型 的 就 是 
java.util.Vector 类 的 实现 。 如 果 程 序 员 要 在 线程 局 部 环境 中 使 用 向 量 , 但 没有 考虑 清楚 的 话 ， 
就 有 可 能 会 使 用 java.util.vector 类 , #25, java.util.ArrayList 类 可 以 完成 同样 的 


任务 ， 还 不 会 有 同步 操作 带 来 的 额外 的 开销 。 


















































































































































AA 对 于 线程 与 同步 的 优化 103 




















从 以 上 可 以 看 出 ， 假 设 大 部 分 锁 都 只 在 线程 局 部 起 作用 而 不 会 出 现 竞争 情况 ， 是 有 道理 的 。 
在 这 种 情况 下 ,使 用 延迟 解锁 的 优化 方式 可 以 提升 系统 性 能 。 当 然 , 天 下 没有 免费 的 午餐 ， 如 果 
某 个 线程 试图 获取 某 个 已 经 延迟 解锁 优化 的 监视 器 对 象 , 这 时 的 执行 开销 会 被 直接 获取 普通 监视 
器 对 象 大 得 多 ， 因 为 这 个 看 似 未 加 锁 的 监视 器 对 象 必须 要 先 被 强行 释放 掉 。 

因此 ， 不 能 一 直 假 设 解锁 操作 是 不 必要 的 ， 需 要 对 不 同 的 运行 时 行为 做 针对 性 的 优化 。 

1. 实现 

实现 延迟 解锁 的 语义 其 实 很 简单 。 

实现 monitorenter 指令 。 

O 如 果 对 象 是 未 锁定 的 ， 则 加 锁 成 功 的 线程 将 继续 持 有 该 锁 ， 并 标记 该 对 象 为 延迟 加 锁 的 。 
口 如 果 对 象 已 经 被 标记 为 延迟 加 锁 的 : 

m 如 果 对 象 是 被 同一 个 线程 加 锁 的 ， 则 什么 也 不 做 (大 体 上 是 一 个 递归 锁 ) 

m 如 果 对 和 象 是 被 另 一 个 线程 加 锁 的 ， 则 暂停 该 线程 对 锁 的 持 有 状态 ， 检 查 该 对 象 真实 的 

加 锁 状 态 ， 即 是 已 加 锁 的 还 是 未 加 锁 的 ， 这 一 步 操 作 代 价 高 昂 ， 需 要 遍历 调用 栈 。 如 

果 对 象 是 已 加 锁 的 ， 则 将 该 锁 转 换 为 瘦 锁 ， 否 则 强制 释放 该 锁 ， 以 便 可 以 被 新 线程 获 

取 到 。 

实现 monitorexit 指令 : 如 果 是 延迟 加 锁 的 对 象 ， 则 什么 也 不 做 ， 保 留 其 已 加 锁 状 态 ， 即 
执行 延迟 解锁 。 

为 了 能 解除 线程 对 锁 的 持 有 状态 ,必须 要 先 暂 停 该 线程 的 执行 ， 这 个 操作 有 不 小 的 开销 。 在 
释放 锁 之 后 , 锁 的 实际 状态 会 通过 检查 线程 栈 中 的 锁 符号 来 确定 , 这 种 处 理 方式 与 之 前 介绍 的 处 
理 不 匹配 的 锁 相 同 。 延 迟 解锁 使 用 自己 的 锁 符 号 ， 以 表示 “该 对 象 是 被 延迟 锁定 的 ”。 

如 果 延 迟 锁定 的 对 象 从 来 也 没有 被 撤销 过 , 即 所 有 的 锁 都 只 在 线程 局 部 内 发 挥 作用 , 那么 使 
用 延迟 锁定 就 可 以 大 幅 提升 系统 性 能 。 但 在 实际 应 用 中 ,如 果 我 们 的 假设 不 成 立 ， 运行 时 就 不 得 
不 一 这 又 一 遍地 释放 已 经 被 延迟 加 锁 的 对 象 ， 这 种 性 能 消耗 实在 承受 不 起 。 因 此 , 运行 时 需要 记 
录 下 监视 器 对 象 被 不 同 线程 获取 到 的 次 数 , 这 部 分 信息 存储 在 监视 器 对 象 的 锁 字 中 ， 称 为 转移 位 
(transfer bit )。 

如 果 监 视 右 对 象 在 不 同 的 线程 之 间 转 移 的 次 数 过 多 , 那么 该 对 象 、 其 类 对 象 或 者 其 类 的 所 有 
实例 都 可 能 会 被 禁用 延迟 加 锁 ， 只 会 使 用 标准 的 胖 锁 和 瘦 锁 来 处 理 加 锁 或 解锁 操作 。 

2. 禁用 对 象 

当 监 视 嚣 对象 在 不 同 的 线程 之 间 转 移 的 次 数 达 到 某 个 羡 值 后 , 运行 时 会 设置 该 对 象 锁 字 中 的 
禁用 标记 位 (forbid bit )。 该 标记 位 用 于 标记 该 对 象 是 否 可 以 用 于 延迟 解锁 。 如 果 置 位 ， 则 该 对 
象 不 可 再 用 于 延迟 解锁 。 

此 外 ,如 果 锁 会 被 其 他 线程 所 竞争 ， 则 不 管 其 他 属性 如 何 设置 ,都 会 立刻 禁用 该 对 象 的 延迟 
解锁 。 

对 于 设置 了 禁用 标记 位 的 对 象 ， 加 锁 操 作 会 按照 胖 锁 或 瘦 锁 处 理 。 

3. 禁用 类 

仅仅 禁止 某 个 对 象 用 于 延迟 解锁 有 时 还 不 太 够 , 同一 类 型 的 实例 作为 锁 使 用 时 通常 具有 类 似 
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的 使 用 模式 ， 因 此 , 直接 禁止 该 类 使 用 延迟 解锁 就 可 以 把 它 所 有 的 实例 都 禁用 了 。 如 果 某 个 类 的 
实例 作为 锁 使 用 时 在 不 同 线程 之 间 转 移 的 次 数 太 多 ， 或 者 某 类 有 太 多 的 实例 被 禁用 于 延迟 解锁 ， 
则 该 类 会 被 禁用 。 
运行 时 会 记录 类 和 某 个 实例 被 设置 禁用 标记 位 的 时 间 ， 当 禁用 时 间 超 过 某 个 阐 值 后 , 会 重新 
尝试 启用 延迟 解锁 。 如 果 此 后 ,发 现 该 类 或 该 对 象 义 被 禁用 了 ， 则 重新 开始 计时 , 但 这 次 阔 值 可 
能 会 变 得 更 大 一 些 ， 也 可 能 会 被 永久 禁用 。 
下 图 展示 了 不 同 锁 状 态 之 间 的 转换 。 
延迟 解锁 瘦 锁 : 胖 锁 
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持 有 锁 的 线程 
的 ID T1 的 ID T2* 的 ID T3* 

于 调用 wait | 

: 方法 而 膨胀 | 

| 收缩 并 解锁 





在 上 图 中 ,， 有 三 种 锁 类 型 ， 其 中 胖 锁 和 瘦 锁 在 之 前 中 介绍 过 ,这 里 新 增 了 延迟 锁 ， 用 来 解释 
锁 在 大 部 分 情况 下 都 只 作用 于 线程 局 部 场景 下 的 情况 。 

正如 之 前 介绍 过 的 ,对 象 首先 是 未 加 锁 状 态 的 ， 然后 线程 T1 执行 monitorenter 指令 , 使 
之 进入 延迟 加 锁 状 态 。 但 如 果 线 程 T1 在 该 对 象 上 执行 了 monitorexit 指令 ， 这 时 系统 会 假装 
已 经 解锁 了 ， 但 实际 上 仍 是 锁定 状态 ， 锁 对 象 的 锁 字 中 仍 记 录 着 线程 T1 的 线程 ID 。 在 此 之 后 ， 
线程 T1 如 果 再 执行 加 锁 操 作 ， 就 不 用 再 执行 相关 操作 了 。 

如 果 男 一 个 线程 T2 试图 获取 同一 个 锁 ， 则 之 前 所 做 “该 锁 绝 大 部 分 被 线 T1 程 使 用 ”的 假 
设 不 再 成 立 ， 会 受到 性 能 惩罚 ， 将 锁 字 中 的 线程 ID 由 线程 T1 的 ID 替换 为 线程 T2 的 。 如 果 这 
种 情况 经 常 出 现 , 那么 可 能 会 禁用 该 对 象 作 为 延迟 锁 ， 并 将 该 对 象 作为 普通 的 瘦 锁 使 用 ,假设 这 
是 线程 T2 第 一 次 在 该 对 象 上 调用 monitorenter 指令 , 则 程序 会 进入 瘦 锁 控制 流程 ,在 上 图 中 ， 
被 禁用 于 延迟 解锁 的 对 象 用 星 号 (* ) 做 了 标记 。 此 时 ， 当 线程 T3 试图 在 某 个 已 被 禁用 于 延迟 解 
锁 的 对 象 上 加 锁 ， 如 果 该 对 象 还 未 被 锁定 ， 则 此 时 仍 会 使 用 瘦 锁 。 

使 用 瘦 锁 时 ， 如 果 竞 争 激烈 ， 或 者 在 锁 对 象 上 调用 了 wait 方法 或 notify 方法 ， 则 瘦 锁 会 
膨胀 为 胖 锁 ， 需 要 等 待 队列 来 处 理 。 从 图 中 可 以 看 到 ， 处 于 延迟 解锁 状态 的 对 象 直 接 调用 wait 
方法 或 notify 方法 的 话 ， 也 会 膨胀 为 胖 锁 。 
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4. 结论 

大 部 分 商业 JVM 实现 都 在 不 同 程度 上 使 用 了 延迟 解锁 机 制 。 有 些 讽刺 的 是 , 之 所 以 会 这 样 ， 
可 能 是 因为 常用 的 SPECjbb2005 基准 测试 中 包含 大 量 线程 局 部 的 锁 , 为 了 能 在 性 能 测试 中 取得 良 
好 的 成 绩 ， 而 特意 做 了 很 多 优化 。 


SPEC (standard performance evaluation corporation ) 是 该 组 织 的 注册 商标 ， 
$> 























而 SPECjbb2005 则 是 其 推出 的 性 能 测试 工具 。 

















但 事实 上 , 在 很 多 应 用 程序 中 , 使 用 延迟 解锁 是 会 有 可 能 提升 系统 性 能 的 。 这 是 因为 应 用 程 
序 的 复杂 性 和 各 种 抽象 层 的 存在 ,使 开发 人 员 难 以 判断 是 否 真 的 有 必要 使 用 同步 操作 。 

在 JRockit 的 某 些 版 本 中 , 例如 在 x86 平 台 上 为 JDK 1.6.0 实现 的 版 本 ,默认 开启 了 延迟 解锁 
和 根据 启发 式 算法 禁用 对 象 (或 类 ) 的 功能 , 用户 可 以 通过 命令 行 参数 关闭 这 两 个 功能 。 想 查看 
某 个 有 下 ockit 版 本 是 否 默认 启用 了 延迟 解锁 ， 请 查看 JRockit 的 相关 文档 。 
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本 节 会 介绍 Java 中 与 线程 和 同步 相关 的 陷阱。 


4.5.1 Thread.stop, Thread.resume 和 Thread.suspend 




















Java 线程 相关 API 中 最 严重 的 问题 是 对 java.lang.Thread 类 中 stop, resume 和 suspend 
方法 的 调用 。 这些 方法 从 Java 1.0 版 本 中 就 存在 , 但 很 快 就 被 发 现存 在 问题 , 并且 不 推荐 再 使 用 。 
尽管 如 此 , 还 是 为 时 已 晚 ， 虽然 已 经 发 出 警告 , 对 这 些 方法 的 调用 至 今 仍 散落 在 世界 各 地 的 历史 
遗留 代码 中 ， 而 且 不 少 新 近 的 应 用 程序 也 仍 在 使 用 ， 我 们 曾 见 到 过 2008 年 开发 的 代码 中 还 在 使 
用 这 些 方法 。 

stop 方法 用 于 终止 线程 的 执行 , 但 并 不 安全 , 这 是 因为 如 果 该 线程 正在 修改 全 局 数据 , 那么 
终止 线程 可 能 会 使 数据 不 一 致 ， 破 坏 应 有 状态 。 接 收 到 终止 信号 的 线程 会 释放 其 持 有 的 锁 ,， 使 正 
在 被 修改 的 数据 对 其 他 线程 可 见 ， 这 违反 了 Java 的 沙 箱 模型 。 

因此 ， 普 遍 建议 使 用 wait 方法 、notify 方法 或 volatile 变量 来 做 线程 间 的 同步 处 理 。 

使 用 suspend 方法 挂 起 一 个 线程 可 能 会 产生 死 锁 ， 即 如 果 线 程 T1 获取 了 锁 对 象 L1， 却 被 
挂 起 了 ， 此 时 另 一 个 线程 T2 试图 获取 锁 L1 就 会 被 阻塞 住 ， 直 到 线程 T1 重新 恢复 执行 并 释放 该 
锁 。 但 如 果 负 责 调用 resume 方法 来 唤醒 线程 T1 的 线程 TS 也 想 获取 锁 L1， 于 是 线程 T3 也 会 
被 阻塞 住 ， 这 时 就 形成 了 死 锁 。 因 此 ，Threadq.resume 方法 和 Thread. suspend 方法 也 因为 过 
于 危险 而 被 弃 用 。 

因此 ， 永远 不 要 使 用 Thread.stop Trike. Thread. resume 方法 或 Thread. syspend 方法 ， 
并 小 心 处 理 使 用 这 些 方法 的 历史 遗留 代码 。 
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4.5.2” 双 检查 锁 


如 果 对 内 存 模型 和 CPU 架构 缺乏 理解 的 话 ， 即 使 使 用 平台 独立 性 很 高 的 Java 做 开发 一 样 会 
遇 到 问题 。 以 下 面 的 代码 为 例 ， 其 目的 是 实现 单 例 模式 。 


public class GadgetHolder { 








private Gadget theGadget; 


public synchronized Gadget getGadget() { 
if (this.theGadget == null) { 
this.theGadget = new Gadget (); 
} 
return this.theGadget; 


7 
} 


上 面 的 代码 是 线程 安全 的 ， 因 为 getcadget 方法 是 同步 的 ， 以 自身 实例 作为 隐 式 监视 器 。 
但 当 Gadget 类 的 构造 函数 已 经 执行 过 一 次 之 后 ,再 执行 同步 操作 看 起 来 有 些 浪费 ， 因此, 为 了 
优化 性 能 ， 将 之 改造 为 下 面 的 代码 。 


public Gadget getGadget() { 


if (this.theGadget == null) { 
synchronized(this) { 
if (this.theGadget == null) { 


this.theGadget = new Gadget(); 
} 
} 
J 
return this.theGadget; 
} 


上 面 的 代码 使 用 了 一 个 看 起 来 很 “聪明 ”的 技巧 ， 如 果 对 象 已 经 存在 ， 则 将 之 返回 , 不 再 执 
行 同 步 操 作 , 而 是 直接 返回 已 有 的 对 象 ; 如 果 对 象 还 未 创建 ， 则 进入 同步 代码 块 ,创建 对 象 并 赋 
值 。 这 样 可 以 保证 “线程 安全 ”。 

上 述 代码 就 是 所 谓 的 双 检 查 锁 ( double checked locking )， 下 面 分 析 一 下 这 段 代码 的 问题 。 假 
设 某 个 线程 经 过 内 层 的 空 值 检 查 ， 开 始 初始 化 thecadget 字段 的 值 ， 该 线程 需要 为 新 对 象 分 配 
内 存 ， 并 对 theGadget 字段 赋值 。 可 是 ， 这 一 系列 操作 并 不 是 原子 的 ， 且 执行 顺序 无 法 保证 。 
如 果 在 此 时 正好 发 生 线程 上 下 文 切换 ， 则 另 一 个 线程 看 到 的 theGadget 字段 的 值 可 能 是 未 经 完 
整 初始 化 的 , 有 可 能 会 导致 外 层 的 控制 检查 失效 ,并 返回 这 个 未 经 完整 初始 化 的 对 象 。 不 仅仅 是 
创建 对 象 可 能 会 出 问题 ， 处 理 其 他 类 型 数据 时 也 要 小 心 。 例 如 , 在 32 位 平台 上 ， 写 和 一 个 long 
型 数据 通常 需要 执行 两 次 32 位 数据 的 写 操作 ， 而 写 入 int 数据 则 无 此 顾 虚 。 

上 述 问题 可 以 通过 将 theGadget 字段 声明 为 volatile 来 解决 ( 注意， 只 在 新 版 本 的 内 存 
模型 下 才 有 效 )， 增 加 的 执行 开销 尽管 比 使 用 synchronized 方法 的 小 , 但 还 是 有 的 。 如 果 不 确 
定 当 前 版 本 的 内 存 模型 是 否 实现 正确 , 不 要 使 用 双 检 查 锁 。 网 上 有 很 多 文章 介绍 了 为 什么 不 应 该 
使 用 双 检 查 锁 ， 不 仅 限于 Java， 其 他 语言 也 是 。 





































































































双 检 查 锁 的 危险 之 处 在 于 ， 在 强 内 存 模型 下 ， 它 很 少 会 使 程序 前 溃 。Intel 

IA-64 平台 就 是 个 典型 示例 ， 其 弱 内 存 模型 臭名 远扬 ， 原 本 好 好 运行 的 Java 应 用 
~ 程序 却 出 现 故障 。 如 果 某 个 应 用 程序 在 x86 平 台 运 行 良好 ,在 x64 平 台 却 出 问题 ， 
人 们 很 容易 怀疑 是 JVM 的 bug， 却 忽视 了 有 可 能 是 Java 应 用 程序 自身 的 问题 。 





使 用 静态 属性 来 实现 单 例 模式 可 以 实现 同样 的 语义 ， 而 无 须 使 用 双 检 查 锁 ， 如 下 所 示 : 


public class GadgetMaker { 
public static Gadget theGadget = new Gadget (); 











} 


Java 语言 保证 类 的 初始 化 是 原子 操作 ，GadgetMaker 类 中 没有 其 他 的 域 ， 因 此 ， 在 首次 主 4 
动 使 用 该 类 时 会 自动 创建 Gadget 类 的 实例 。 并 赋值 给 thecadget 字段 。 这 种 方法 在 新 旧 两 种 
内 存 模型 下 均 可 正常 工作 。 
总 之 , 使 用 Java 做 并 行程 序 开发 有 很 多 需要 小 心 的 地 方 , 如果 能 够 正确 理解 Java 内 存 模型 ， 
那么 是 可 以 避 开 这 些 陷阱 的 。 开发 人 员 往 往 不 太 关 心 当前 的 硬件 架构 , 但 如 果 不 能 理解 Java 内 存 
模型 ， 迟早 会 搬 起 石头 砸 自己 的 脚 。 






































46 ”相关 命令 行 参数 


本 节 将 会 介绍 最 重要 的 与 控制 、 分 析 JRockit 中 锁 的 行为 相关 的 命令 行 参数 。 
尽管 使 用 这 些 参 数 后 可 以 从 相关 的 日 志文 件 中 得 到 大 量 信息 ， 但 同步 操作 还 是 比较 复杂 的 ， 
推荐 使 用 JRockit Mission Control 套件 来 进行 可 视 化 的 分 析 。 


4.6.1 检查 锁 与 延迟 解锁 


本 节 将 会 介绍 控制 相关 锁 的 行为 的 命令 行 参数 。 
1. 使 用 -Xxverbose:1locks 标志 分 析 锁 的 行为 
使 用 参数 -Xverbose:locks 可 以 让 JRockit 打印 出 与 同步 操作 相关 的 信息 ， 其 中 大 部 分 信 
息 与 延迟 解锁 相关 ,例如 可 以 看 到 哪个 类 或 哪些 对 象 被 临时 或 永久 禁用 了 , 还 可 以 看 到 延迟 解锁 
是 否 一 直 按 照 最 初 设想 正常 运转 。 

下 面 使 用 参数 -xverbose:1ocks 打印 出 了 一 些 示 例 内 容 , 在 其 中 可 以 看 到 ， 某 些 类 不 适 和 
使 用 延迟 解锁 ， 因 此 在 后 续 的 执行 中 会 被 禁用 。 


hastur:SPECjbb2005 marcus$ java -Xverbose:locks -cp jbb.jar:check. 
jar spec.jbb.JBBmain -propfile SPECjbb.props >/dev/null 












































[INFO ][locks ] Lazy unlocking enabled 

[INFO ][locks ] No of CPUs: 8 

[INFO ][locks ] Banning spec/jbb/Customer for lazy unlocking. 
(forbidden 6 times, limit is 5) 
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[INFO ] [locks ] Banning spec/jbb/Address for lazy unlocking. 


(forbidden 6 times, limit is 5) 


[INFO ] [locks ] Banning java/lang/Object for lazy unlocking. 


(forbidden 5 times, limit is 5) 


[INFO ] [locks ] Banning spec/jbb/TimerData for lazy unlocking. 


(forbidden 6 times, limit is 5) 


[INFO ][locks ] Banning spec/jbb/District for lazy unlocking. 


(forbidden 6 times, limit is 5) 


2. 使 用 标志 -xx:UseLazyUnlocking 控制 延迟 解锁 








在 不 同 的 平台 和 不 同 JRockit 版 本 中 ,默认 是 否 启用 延迟 解锁 的 设 定 不 尽 相 同 ,请 依据 JRockit 
文档 或 根据 -Xverbose:1ocks 标志 的 输出 来 判断 。 虽 然 延迟 解锁 有 时 会 自行 退化 为 普通 的 锁 操 
作 ， 但 大 部 分 情况 下 ， 启 用 延迟 解锁 确实 是 可 以 提升 系统 性 能 的 。 


可 以 使 用 命令 行 参数 -XX :UseLazyUnlocking=false 或 -XX: UseLazyUnlocking=true 




















来 显 式 控制 是 否 启用 延迟 解锁 。 





最 后 , 使 用 命令 行 参数 -xverbose:codegen 可 以 打印 出 有 哪些 方法 出 现 了 锁 操 作 不 匹配 的 





情况 。 
46.2 ”输出 调用 栈 信息 


向 JRockit 进程 发 送 sSTGoUIT 信号 可 以 使 IRockit 打印 








出 JVM 中 所 有 线程 (包括 


Java 线程 


和 本 地 线程 ) 的 完整 调用 栈 信息 , 在 类 Unix 系统 上 可 以 使 用 kil11l1 -QIUT <PID> 命 令 或 kill -3 


<PID> 命 令 发 送 SIGQUIT 信和 号, 在 Windows 系统 上 可 以 在 


送 SIGQUIT 信号 。 在 打印 出 的 线程 调用 栈 信息 中 ,会 带 有 相关 锁 的 锁 符号 及 类 


一 个 简陋 方法 快速 判断 是 否 出 现 了 死 锁 。 
下 面 是 线程 调用 栈 的 示例 内 容 ,其 中 包括 了 锁 的 持 有 者 、 


===== FULL THREAD DUMP =============== 
Tue Jun 02 14:36:39 2009 








控制 台中 通过 ctrl-Break 








组 合 键 发 


型 信息 ， 可 作为 





锁 的 类 型 以 及 锁 在 何 处 被 获得 


BEA JRockit(R) R27.6.3-40_0-112056-1.6.0_11-20090318-2104-windows-ia32 


"Main Thread" id=1 idx=0x4 tid=4220 prio=5 alive, 
in native, sleeping, native_waiting 
at java/lang/Thread.sleep(J)V(Native Method) 


at spec/jbb/JBButil.SecondsToSleep(J)V(Unknown Source) 
at spec/jbb/Company.displayResultTotals(Z)V(Unknown Source) 


at spec/jbb/JBBmain.DoARun(Lspec/jbb/Company; 


SII)V(Unknown Source) 


at spec/jbb/JBBmain.runWarehouse(IIF)Z(Unknown Source) 


at spec/jbb/JBBmain.doIt()V(Unknown Source) 
at spec/jbb/JBBmain.main([Ljava/lang/String; ) 


V(Unknown Source) 


at jrockit/vm/RNI.c2java(IIIII)V(Native Method) 


-- end of trace 


"(Signal Handler)" id=2 idx=0x8 tid=1236 prio=5 alive, in native, daemon 
"(GC Main Thread)" id=3 idx=0xc tid=5956 prio=5 alive, 


in native, native_waiting, daemon 


"(GC Worker Thread 1)" id=? idx=0x10 tid=5884 prio=5 alive, 


in native, daemon 


"(GC Worker Thread 2)" id=? idx=0x14 tid=3440 prio=5 alive, 


号 等 Ao 
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in native, daemon 

"(GC Worker Thread 3)" id=? idx=0x18 tid=4744 prio=5 alive, 
in native, daemon 

"(GC Worker Thread 4)" id=? idx=0x1c tid=5304 prio=5 alive, 
in native, daemon 

"(GC Worker Thread 5)" id=? idx=0x20 tid=5024 prio=5 alive, 
in native, daemon 

"(GC Worker Thread 6)" id=? idx=0x24 tid=3632 prio=5 alive, 
in native, daemon 

"(GC Worker Thread 7)" id=? idx=0x28 tid=1924 prio=5 alive, 
in native, daemon 

"(GC Worker Thread 8)" id=? idx=0x2c tid=5144 prio=5 alive, 
in native, daemon 

"(Code Generation Thread 1)" id=4 idx=0x30 tid=3956 prio=5 alive, 
in native, native_waiting, daemon 

"(Code Optimization Thread 1)" id=5 idx=0x34 tid=4268 prio=5 alive, 
in native, native_waiting, daemon 

"(VM Periodic Task)" id=6 idx=0x38 tid=6068 prio=10 alive, 
in native, native_blocked, daemon 

"(Attach Listener)" id=7 idx=0x3c tid=6076 prio=5 alive, 
in native, daemon 





"Thread-7" id=18 idx=0x64 tid=4428 prio=5 alive 

at spec/jbb/infra/Util/TransactionLogBuffer.privText 
(Ljava/lang/String; IIIS) V(UnknownSource) [optimized] 

at spec/jbb/infra/Util/TransactionLogBuffer.putText 
(Ljava/lang/String;IIIS)V(Unknown Source) [inlined] 

at spec/jbb/infra/Util/TransactionLogBuffer.putDollars 
(Ljava/math/BigDecimal;III)V(Unknown Source) [optimized] 

at spec/jbb/NewOrderTransaction.processTransactionLog() 
v(Unknown Source) [optimized] 

4-- Holding lock: spec/jbb/NewOrderTransaction@0x0D674030[biased lock] 

at spec/jbb/TransactionManager.runTxn(Lspec/jbb/Transaction;JJD) 
J(Unknown Source) [inlined] 

at spec/jbb/TransactionManager.goManual (ILspec/jbb/TimerData; ) 
J(Unknown Source) [optimized] 

at spec/jbb/TransactionManager.go()V(Unknown Source) [optimized] 

at spec/jbb/JBBmain.run()V(Unknown Source) [optimized] 

at java/lang/Thread.run(Thread.java:619) [optimized] 

at jrockit/vm/RNI.c2java(IIIII)V(Native Method) 

-- end of trace 


"Thread-8" id=19 idx=0x68 tid=5784 prio=5 alive, 

in native, native_blocked 

at jrockit/vm/Locks.checkLazyLocked(Ljava/lang/Object; ) 
I(Native Method) 

at jrockit/vm/Locks.monitorEnterSecondStage (Locks. java:1225) 

at spec/jbb/Stock.getQuantity()I(Unknown Source) [inlined] 

at spec/jbb/Orderline.process (Lspec/jbb/Item;Lspec/jbb/Stock; ) 
v(Unknown Source) [optimized] 

at spec/jbb/Orderline.validateAndProcess (Lspec/jbb/Warehouse; ) 
Z(Unknown Source) [inlined] 

at spec/jbb/Order.processLines (Lspec/jbb/Warehouse; SZ) 
Z(Unknown Source) [inlined] 

at spec/jbb/NewOrderTransaction.process()Z(Unknown Source) [optimized] 

4-- Holding lock: spec/jbb/Orderline@0x09575D00 [biased lock] 
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^-- Holding lock: spec/jbb/Order@0x05DDB4E8 [biased lock] 

at spec/jbb/TransactionManager.runTxn (Lspec/jbb/Transaction;JJD) 
J(Unknown Source) [inlined] 

at spec/jbb/TransactionManager.goManual (ILspec/jbb/TimerData; ) 
J(Unknown Source) [optimized] 

at spec/jbb/TransactionManager.go()V(Unknown Source) [optimized] 

at spec/jbb/JBBmain.run()V(Unknown Source) [optimized] 

at java/lang/Thread.run(Thread.java:619) [optimized] 

at jrockit/vm/RNI.c2java(IIIII)V(Native Method) 

-- end of trace 


"Thread-9" id=20 idx=0x6c tid=3296 prio=5 alive, 

in native, native_blocked 

at jrockit/vm/Locks.checkLazyLocked (Ljava/lang/Object; ) 
I(Native Method) 

at jrockit/vm/Locks.monitorEnterSecondStage (Locks. java:1225) 

at spec/jbb/Stock.getQuantity()I(Unknown Source) [inlined] 

at spec/jbb/Orderline.process (Lspec/jbb/Item; Lspec/jbb/Stock; ) 
V(Unknown Source) [optimized] 

at spec/jbb/Orderline.validateAndProcess (Lspec/jbb/Warehouse; ) 
Z(Unknown Source) [inlined] 

at spec/jbb/Order.processLines (Lspec/jbb/Warehouse; SZ) 
Z(Unknown Source) [inlined] 

at spec/jbb/NewOrderTransaction.process()Z(Unknown Source) [optimized] 

4-- Holding lock: spec/jbb/Orderline@0x09736E10 [biased lock] 

4-- Holding lock: spec/jbb/Order@0x09736958 [biased lock] 

at spec/jbb/TransactionManager.runTxn(Lspec/jbb/Transaction;JJD) 
J(Unknown Source) [inlined] 

at spec/jbb/TransactionManager.goManual (ILspec/jbb/TimerData; ) 

J(Unknown Source) [optimized] 

at spec/jbb/TransactionManager.go()V(Unknown Source) [optimized] 

at spec/jbb/JBBmain.run()V(Unknown Source) [optimized] 

at java/lang/Thread.run(Thread.java:619) [optimized] 


4.6.3 air 


JRockit 可 以 对 运行 中 程序 内 的 锁 做 详细 的 分 析 ， 但 会 产生 一 些 性 能 开销 ， 根 据 应 用 程序 的 
具体 情况 不 同 ， 一 般 会 增加 3% 或 更 多 的 开销 。 

更 多 有 关 分 析 锁 信息 的 详细 内 容 ， 请 参见 第 6 章 。 

使 用 标志 -XX:UseLockProfiling 进行 锁 分 析 

使 用 命令 行 参数 -xx:UseLockProfiling=true 可 以 让 JRockit 打印 出 Java 应 用 程序 将 时 
间 都 花 在 了 哪里 ，JRockit 会 监控 Java 应 用 程序 中 的 加 锁 和 解锁 操作 ， 记 录 下 何 种 条 件 下 发 生 ， 
以 及 发 生 的 次 数 。 使 用 命令 行 参数 -XX:UseNativeLockProfiling=true 可 以 打印 出 JVM 内 
对 本 地 锁 的 使 用 情况 ， 例 如 代码 缓冲 区 的 锁 和 垃圾 回收 器 锁 获 取 到 的 锁 。 

JRockit Mission Control 可 以 用 来 分 析 应 用 程序 运行 过 程 中 锁 的 使 用 情况 ，Java 应 用 程序 和 
JVM 内 部 的 锁 都 会 有 记录 ， 记 录 内 容 包括 作为 瘦 锁 或 胖 锁 使 用 的 次 数 、 被 不 同 线程 竞争 的 情况 、 
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延迟 解锁 的 使 用 情况 等 。 

e JRCMD 

作为 JRockit IDK 的 一 部 分 ， 命 令 行 工具 IRCMD 也 可 以 用 来 控制 锁 的 分 析 行 为 。 当 启用 了 
-XX:UseLockProfiling=true 参 数 后 ,JRCMD 可 以 对 lockprofile_reset fil lock-profile_ 
print 命令 做 出 响应 ,分 来 用 来 清空 锁 性 能 计数 絮 和 打印 锁 性 能 计数 器 到 控制 台 。 

更 多 有 关 如 何 使 用 IRCMD 的 内 容 请 参见 第 11 章 。 


46.4 设置 线程 栈 的 大 小 


命令 行 参 数 -xss 可 用 于 指定 线程 栈 的 大 小 , 例如 参数 -xss :256k 用 于 将 栈 的 大 小 设置 为 
256 KB 。 线 程 栈 是 每 个 Java 线程 内 部 专用 的 内 存 区 域 ， 线 程 可 在 其 中 存储 程序 执行 状态 。 增 加 
线程 栈 的 大 小 没什么 实际 意义 ， 除 非 是 程序 中 有 递归 调用 或 者 有 大 量 的 栈 内 局 部 信息 存在 。 

不 同 的 平台 上 ， 线 程 栈 的 默认 大 小 不 尽 相 同 ， 具 体 值 请 参见 JRockit 文档 说 明 。 

当 程序 运行 时 抛 出 StackOverflowError 错误 时 ， 除 非 是 程序 中 存在 无 限 递归 ， 和 否则 一 般 
情况 下 可 以 通过 调 大 线程 栈 来 解决 。 


46.5 ”使 用 命令 行 参 数控 制 锁 的 行为 


在 耻 ockit 中 ， 可 以 使 用 命令 行 参数 来 控制 锁 的 启发 式 算 法 。 例 如 ， 使 用 标志 -XX:UseFat- 
Spin=false 可 以 禁止 在 胖 锁 中 使 用 自 旋 锁 , 否则 默认 是 启用 的 ; 使 用 标志 -XxX:UseAdapt ive- 
FatSpin=true 可 以 启用 自 适 应 运行 时 反馈 ,以便 调节 胖 锁 中 自 旋 锁 的 行为 , 否则 默认 是 禁用 的 。 

还 有 一 些 标志 可 用 来 调整 延迟 解锁 、 锁 膨胀 和 锁 收 缩 的 行为 ， 通 常 来 说 不 必 使 用 这 些 标志 ， 
为 满足 读者 的 好 奇 心 ， 第 5 章 会 详细 介绍 JRockit 中 调节 锁 的 小 技巧 。JRockit 文档 中 也 包含 了 所 
有 可 用 的 命令 行 参数 。 
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在 并 行 环境 下 ， 编 码 和 调试 都 不 是 件 轻 松 的 事 ， 在 Java 内 建 的 同步 机 制 和 JDK 自 带 的 相关 
数据 结构 的 帮助 下 ， 工 作 会 稍微 轻松 一 点 。Java 在 语言 级 支持 同步 操作 ， 每 个 对 象 都 可 以 作为 监 
视 右 对 象 来 实现 同步 。 要 说 缺点 的 话 ， 灵 怕 就 是 同步 操作 太 容易 使 用 ， 可 能 会 被 滥用 。 

本 章 简单 介绍 了 Java 内 存 模型 和 旧版 内 存 模型 的 问题 ， 内 存 模 型 的 存在 使 Java 在 各 个 硬件 
平台 的 行为 得 以 统一 。 

此 外 ,本 章 简 单 讲 解 了 虚拟 机 中 同步 和 线程 的 实现 ， 并 用 瘦 锁 和 胖 锁 来 介绍 自 适应 锁 的 常见 实 
现 。 在 自 适 应 环境 中 , 运行 时 系统 会 根据 收集 到 的 反馈 信息 来 调节 锁 的 行为 , 引发 锁 的 膨胀 或 收缩 。 

本 章 简 单 介绍 了 锁 的 一 些 基 本 优化 方法 , 其 中 效果 最 显著 的 优化 是 延迟 解锁 ,以 及 代码 生成 
器 为 执行 锁 融 合 而 做 的 优化 。 
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4.5 方 介绍 了 并 行 编程 中 常见 的 一 些 陶 阱 ， 包 括 Thread.stop 方法 、Thread.suspend 方 
法 和 Thread.resume 方法 ， 以 及 双 检 查 锁 存在 的 问题 。 当 然 ， 并 行 编程 中 最 大 的 陷阱 就 是 不 











理解 Java 内 存 模 型 。 
最 后 ,本章 简要 介绍 了 JRockit 中 与 线程 和 同步 相关 的 命令 行 参 数 ,以 及 一 些 可 用 于 控制 JVM 
中 锁 行 为 的 参数 。 


下 一 章 将 会 介绍 应 用 程序 的 基准 测试 。 使 用 基准 测试 可 以 避免 应 用 程序 在 开发 过 程 中 出 现 性 
能 退步 的 情况 , 还 可 以 为 性 能 优化 提供 有 用 的 数据 。 只 有 深入 理解 JVM 的 内 部 原理 和 运行 机 制 ， 
才能 做 好 基准 测试 和 性 能 测量 。 到 目前 为 止 , 本 书 已 经 简单 讲解 了 代码 生成 、 内 存 管理 和 线程 同 
步 的 基础 知识 ， 和 希望 读者 能 有 所 收获 。 
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本 章 将 介绍 如 何 通 过 基准 测试 来 衡量 应 用 程序 的 性 能 , 以 及 如 何 对 JVM 进行 调 优 , 以便 Java 
应 用 程序 可 以 运行 得 更 快 。 

基准 测试 可 以 而 且 也 应 该 用 来 在 开发 过 程 中 对 应 用 程序 进行 回归 测试 , 以 确保 对 应 用 程序 的 
新 近 修改 不 会 降低 原 有 的 性 能 。 我 在 职业 生涯 中 已 经 见 过 多 次 因 无 心 的 修改 而 导致 性 能 下 降 的 案 
Bil, 应 用 持续 的 、 自 动 化 的 基准 测试 可 以 避免 这 种 情况 的 发 生 。 每 个 软件 项 目 都 有 期 望 的 性 能 上 
标 ， 而 基准 测试 就 是 为 此 保驾 护航 的 。 

在 讨论 为 何以 及 如 何 做 好 基准 测试 时 , 还 会 介绍 如 何 通过 基准 测试 给 出 的 性 能 指标 得 出 相关 
结论 ， 以 及 为 达到 期 望 的 目标 ， 何 时 需要 修改 应 用 程序 或 者 JVM 参数 配置 。 调 优 方面 的 内 容 会 
以 JRockit 为 例 进行 讲解 。 

本 章 的 主要 内 容 如 下 。 

口 使 用 基准 测试 找 出 应 用 程序 的 性 能 瓶颈 ， 防 止 应 用 程序 在 开发 过 程 中 出 现 性 能 下 降 的 情 
况 ， 确 保 达 到 预期 的 性 能 目标 。 

口 如 何 针 对 特定 的 问题 建立 基准 测试 ， 这 其 中 包括 确定 基准 测试 所 要 测量 的 指标 ， 以 及 如 
何 从 应 用 程序 中 抽取 待 测试 功能 。 

口 介绍 几 种 可 测试 Java 应 用 程序 的 、 具 有 工业 标准 的 基准 测试 工具 。 
口 如 何 根据 基准 测试 的 结果 对 应 用 程序 和 JVM 进行 性 能 调 优 。 
口 如 何 识别 及 规避 Java 应 用 程序 中 的 性 能 瓶颈 ， 其 中 包括 常见 陷阱 、 错 误 以 及 伪 优 化 。 









































本 章 还 会 介绍 SPEC 基准 测试 。SPEC 是 一 个 非 营利 性 组 织 , 其 宗旨 是 建立 、 
维护 和 推广 用 于 评估 新 一 代 计 算 机 系统 性 能 的 基准 测试 程序 。 对 于 本 章 中 所 提 到 
的 SPEC 的 产品 和 服务 ，SPCE 组 织 拥 有 知识 产权 ， 受 法 律 保 护 。 


5.1 为 何 要 进行 基准 测试 
对 于 复杂 系统 来 说 ,基准 测试 是 必 不 可 少 的 , 具体 原因 有 很 多 ,例如 确保 应 用 程序 在 生产 环 


境 中 可 用 , 或 者 新 添加 的 代码 不 会 降低 系统 性 能 。 此 外 ,还 可 以 使 应 用 程序 定向 崩 江 ,暴露 出 潜 
在 问题 ， 以 便 进行 优化 。 最 后 要 提醒 的 是 ， 使 用 基准 测试 并 不 是 为 了 迎合 市 场 。 
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5.1.1 制定 性 能 目标 


基准 测试 涉及 软件 开发 的 方方面面 , 从 OEM 或 JVM 厂商 到 独立 Java 应 用 程序 的 开发 者 等 。 
很 多 时 候 , 软件 的 功能 性 目标 有 清楚 的 定义 , 却 没 有 明确 性 能 目标 ,当然 也 就 没有 对 应 的 基准 测 
试 ， 这 样 做 出 的 产品 往往 是 不 具有 可 用 性 的 。 在 笔者 的 职业 生涯 中 ， 这 样 的 案例 已 经 见 过 太 多 ， 
甚至 一 些 商 业 的 关键 系统 也 缺乏 明确 的 性 能 目标 。 如 果 系 统 的 性 能 问题 在 开发 周期 的 末尾 才 被 发 
Bh, 那么 有 可 能 整个 应 用 程序 都 不 得 不 推倒 重 来 。 








在 任何 软件 的 开发 过 程 中 , 性 能 方面 的 基准 测试 是 基础 环节 之 一 。 要 明确 性 
能 目标 ,建立 对 应 的 基准 测试 ,检验 测试 结果 ,调整 应 用 程序 ， 并 上 且 重复 这 个 过 
程 直 到 开发 结束 。 





一 般 情 况 下 ,为 了 避免 产品 上 线 后 出 现 乾 粹 的 问题 ,在 软件 开发 过 程 中 ,达到 指定 的 性 能 
标 是 基础 要 求 ， 而且 在 开发 过 程 中 也 应 不 断 检验 产品 的 性 能 。 不 要 低估 产品 性 能 的 重要 性 ,应 与 
其 他 bug 同等 对 待 。 























5.1.2 ”对 性 能 进行 回归 测试 


如 果 应 用 程序 在 开发 过 程 中 没有 良好 的 质量 保证 (QA ) 框架 来 把 关 ， 那 么 在 上 线 后 就 很 有 
会 出 现 各 种 错误 ,以 及 运行 不 稳定 等 情况 。 更 具体 一 点 说 ,在 添加 新 代码 后 没有 经 过 完整 的 
性 单元 测试 ， 那 么 无 论 代 码 评审 如 何 恨 好 ， 这 些 代码 都 有 可 能 会 使 应 用 程序 崩溃 。 
使 用 回归 测试 的 首要 目标 是 保持 应 用 程序 的 稳定 性 。 当 发 现 故 障 并 修复 时 , 最 好 能 在 调试 系 
统 时 留 下 的 代码 的 基础 上 写 一 个 可 以 使 问题 复 现 (reproducer ) 的 程序 ， 理 想 的 复 现 程序 是 能 够 
解决 系统 出 现 的 任何 问题 是 只 包含 几 行 代码 的 main 函数 ， 不 过 即使 它 更 复杂 ， 花 时 间 将 其 集成 
到 回归 测试 中 也 是 值得 的 ， 提 交 新 代码 后 执行 回归 测试 可 以 防止 同样 的 问题 再 次 发 生 。 当 然 ,， 功 
能 测试 并 不 容易 集成 到 回归 测试 或 自 包 含 的 复 现 程序 中 。 对 于 那些 难以 安装 又 需要 长 时 间 运 行 的 
应 用 程序 来 说 ， 用 回归 测试 来 验证 稳定 性 仍然 很 有 必要 。 

执行 回归 测试 的 另 一 个 目的 是 保持 应 用 程序 的 执行 性 能 。 出 于 某 些 原因 ， 人 们 对 性 能 测试 的 
重视 程度 远 比 不 上 功能 测试 , 但 实际 上 , 它们 都 非常 重要 。 新 增 代码 很 有 可 能 因 性 能 问题 而 使 系 
统 的 功能 衰退 ， 相 比 于 功能 问题 ， 性 能 问题 更 难以 定位 ， 因 为 系统 一 般 不 会 因 性 能 问题 而 前 演 。 
因此 , 将 性 能 测试 集成 到 质量 保证 框架 中 是 很 有 必要 的 。 性 能 问题 隐藏 得 越久 , 定位 问题 的 难度 
就 越 大 ,这 可 能 会 涉及 新 近 提 交 的 一 大 批 源 代码 ， 而 开发 人 员 为 了 定位 性 能 ， 有 可 能 需要 针对 每 
次 修改 重新 编译 并 行 应 用 程序 ， 这 将 耗费 大 量 的 时 间 。 


| 完善 的 质量 保证 框架 中 应 该 包含 功能 测试 模块 和 性 能 测试 模块 ,性 能 问题 和 | 
> y 











































































































能 问题 具有 相同 的 重要 性 。 
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性 能 回归 测试 还 可 以 用 来 探究 性 能 的 异常 变化 。 不 明 原 因 的 性 能 提升 看 似 不 错 , 但 实际 上 可 
能 是 引入 了 某 些 故障 ， 例 如 某 些 关键 代码 没有 被 执行 。 一 般 来 说 ， 当 出 现 性 能 异常 时 ， 应 该 深入 
探究 其 原因 ， 不 论 性 能 是 提升 还 是 降低 ， 都 应 该 可 以 通过 性 能 回归 测试 得 到 警告 信息 。 

在 做 性 能 回归 测试 时 , 为 了 尽快 定位 问题 ， 应 测量 尽 可 能 多 的 性 能 指标 。 如 果 可 以 的 话 , 代 
码 中 的 每 个 修改 都 应 该 有 回归 测试 。 

现在 暂时 把 复杂 系统 的 回归 测试 放 在 一 边 ,， 先 来 谈 谈 可 作为 单元 测试 的 小 程序 。 针 对 性 能 方 
面 的 单元 测试 称 为 微 基 准 测试 (micro benchmark )。 微 基准 测试 应 该 易于 配置 ， 一 般 运 行 时 间 不 
长 ， 可 以 快速 判断 出 是 否 达 到 了 预定 的 性 能 要 求 。 后 续 章 节 会 详细 介绍 微 基 准 测试 。 


5.1.3 ”确定 优化 方向 


使 用 基准 测试 的 男 一 个 原因 是 ,衡量 系统 性 能 是 很 困难 的 ， 例 如 ,， “性 能 好 ” 既 可 以 是 高 否 
吐 量 ,也 可 以 是 低 延 迟 ,， 二 者 难以 兼 得 。 因 此 谈 性 能 就 要 先 确 定 到 底 谈 的 是 哪个 方面 ,否则 如 何 
说 应 用 程序 的 性 能 是 好 还 是 坏 呢 ? 

从 通用 的 质量 保证 框架 的 角度 看 , 尽管 让 应 用 程序 处 于 高 工作 负载 状态 更 便于 测试 , 但 这 样 
做 却 可 能 会 使 测试 程序 过 于 复杂 ， 因 而 无 法 定位 具体 问题 。 

如 果 应 用 程序 可 以 划分 为 多 个 小 的 子 系统 , 然后 对 每 个 子 系统 分 别 进行 基准 测试 , 那么 就 可 
以 避免 很 多 麻烦 , 不 仅 更 易于 测试 应 用 程序 的 各 个 方面 ,也 更 容易 针对 某 一 方面 的 性 能 进行 调 优 。 
进一步 说 , 划分 为 小 的 子 系统 也 更 容易 验证 代码 优化 方面 的 工作 是 否 真正 有 用 。 开发 工程 师 们 应 
该 认识 到 ， 优 化 工作 所 涉及 的 因素 越 少 ， 越 容易 判定 优化 工作 是 否 有 效 。 

此 外 ,如 果 简 单 的 、 自 包含 的 基准 测试 能 够 正确 反映 应 用 程序 的 运行 行为 , 则 针对 该 基准 测 
试 所 做 的 性 能 优化 就 更 具有 适用 性 。 因此, 优化 基准 测试 而 不 是 整个 应 用 程序 可 以 大 大 加 快 开发 
进度 。 


5.1.4 ”商业 应 用 


最 后 要 提 到 的 是 , 目前 互联 网 上 已 有 大 量 针 对 不 同类 型 应 用 程序 和 不 同 运行 环境 的 工业 级 基 
准 测 试 工具 ， 其 中 一 些 很 适合 用 于 检验 、 测 量 某 个 特定 领域 的 程序 性 能 ， 例 如 处 理 XML 文件 、 
解码 MP3 文件 、 处 理 数据 库 事务 等 。 

工业 级 基准 测试 还 给 出 了 业界 同类 产品 普遍 关注 的 一 些 性 能 指标 。 本 章 后 面 会 介绍 一 些 常 见 
的 、 针 对 JVM 和 Java 应 用 程序 的 工业 级 基准 测试 工具 。 









































































































































基于 标准 基准 测试 的 评分 来 做 市 场 营 销 是 以 OEM( 或 JVM ) 为 中 心 的 做 法 ， 
对 于 存在 很 多 竞争 厂商 的 市 场 领域 来 说 ,借助 基准 测试 可 以 开发 出 更 有 竞争 力 的 
产品 。 


























产品 能 够 在 公认 的 基准 测试 中 取得 极 佳 的 成 绩 ， 对 于 市 场 营 销 来 说 是 一 项 极 大 的 优势 。 
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5.2 如何 构建 基准 测试 


如 果 不 清 楚 应 用 程序 的 行为 ， 就 无 法 创建 有 效 的 基准 测试 , 无 论 大 或 小 。 要 想 弄 清 哪些 基准 
测试 与 应 用 程序 性 能 相关 ， 就 需要 先 对 应 用 程序 做 全 面 的 分 析 。 

有 不 少 工具 可 用 来 检测 Java 应 用 程序 ， 有 些 通过 修改 字 节 码 来 创建 一 个 应 用 程序 的 特别 版 
本 来 检测 ， 有 些 则 可 以 在 不 修改 原 有 程序 的 基础 上 进行 在 线 分 析 , JRockit Mission Control 套件 使 
用 的 是 后 者 的 方法 。 在 本 书 的 下 一 个 部 分 会 详细 介绍 JRockit Mission Control, 

对 应 用 程序 的 详细 分 析 可 以 揭示 出 运行 时 把 时 间 都 花 在 哪些 方法 上 了 , 垃圾 回收 工作 是 什么 
运行 模式 ， 以 及 哪些 锁 竞 争 激烈 ， 哪 些 锁 没 什么 竞争 等 信息 。 

KEX, 分 析 应 用 程序 并 不 一 定 非得 要 用 什么 神奇 的 工具 , 一 切 从 简 的 话 , 直接 用 System.out. 
println 方法 在 控制 台 打印 出 相关 信息 即 可 。 

当 收 集 到 了 足够 的 信息 后 ， 可 以 开始 将 应 用 程序 划分 为 具体 的 子 程序 以 分 别 进行 基准 测 
试 。 在 创建 基准 测试 之 前 ， 还 需要 仔细 确认 一 下 选 定 的 子 程序 和 基准 测试 是 否 聚 焦 于 同一 个 性 
能 问题 。 

在 对 应 用 程序 正式 进行 基准 测试 之 前 , 要 注意 先 让 应 用 程序 热身 (warm-up )， 以 使 其 达到 稳 
定 运行 的 状态 。 此 外 ， 思 考 以 下 问题 。 
口 为 了 简便 起 见 ， 是 否 可 以 将 应 用 程序 调整 为 一 个 具有 和 较 短 启动 时 间 的 、 自 包含 的 基准 测 
试 程序 ? 
口 如 果 基 准 测试 时 间 从 1 小 时 缩水 到 5 分钟 ( 其 中 还 包括 了 热身 时 间 )， 那 么 这 种 比较 还 有 
意义 吗 ? 或 者 说 ,测试 时 间 缩 水 的 话 能 得 到 正确 的 测试 结果 吗 ? 
口 基准 测试 是 否 会 改变 应 用 程序 原 有 的 行为 ? 












































































































































| 服务 器 端 应 用 程序 通常 有 多 个 功能 子 模块 ， 适合 对 每 个 特定 领域 做 基准 测试 。 ] 



































理想 的 基准 测试 是 一 个 模拟 运行 应 用 程序 某 一 部 分 的 、 自 包含 的 小 程序 。 如 果 某 个 目标 应 用 
程序 不 易 安 装 ， 而 且 要 处 理 的 输入 数据 太 多 ,因而 不 易 编 写 基 准 测试 程序 的 话 , 那么 可 以 尝试 继 
续 细 分 该 应 用 程序 ,将 之 分 解 为 一 些 可 以 处 理 有 限 输 入 数据 的 黑 盒 , 然后 对 这 些 黑 盒 做 基准 测试 ， 
以 此 为 基准 对 整个 应 用 程序 做 出 判断 。 


5.2.1 置身 事 外 


除了 一 些 非 常 小 的 基准 测试 和 验证 某 些 概念 的 代码 外 , 在 做 基准 测试 时 ， 最 好 能 够 “置身 事 
yh” (outside the system )。 所 谓 “ 置 身 事 外 ”是 指 通过 一 些 外 部 驱动 程序 (external driver ) 来 运 
行 基准 测试 。 在 测试 系统 性 能 时 ， 驱 动 程序 独立 于 基准 测试 代码 之 外 运行 。 

驱动 程序 通常 会 增加 基准 测试 的 工作 量 , 例如 运行 基准 测试 的 话 会 增加 网 络 传输 开销 。 因 此 
如 果 基 准 测试 要 测量 应 用 程序 的 响应 时 间 ， 得 到 的 测试 结果 中 会 包括 这 部 分 通信 时 间 。 
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使 用 驱动 程序 的 好 处 是 可 以 精确 测量 应 用 程序 的 响应 时 间 , 且 不 会 受到 数据 生成 或 工作 负载 
的 影响 。 为 了 进一步 保证 测量 的 准确 性 ,可 以 将 驱动 程序 放置 在 另 一 台 服务 器 上 ， 确 保 数据 生成 
或 工作 负载 不 会 成 为 基准 测试 中 的 瓶 须 ， 使 驱动 程序 可 以 保持 在 较 低 的 工作 负载 下 运行 。 

下 面 的 示例 代码 中 ， 使 用 随机 数据 测试 MD5 算法 ， 这 个 例子 很 好 地 说 明了 为 什么 执行 基准 
测试 时 要 置身 事 外 。 


import java.util.Random; 
import java.security.*; 

















public class Md5ThruPut { 
static MessageDigest algorithm; 
static Random r = new Random(); 
static int ops; 


public static void main(String args[]) throws Exception { 
algorithm = MessageDigest.getInstance("MD5"); 
algorithm.reset(); 
long t0 = System.currentTimeMillis(); 
test (100000) ; 
long t1 = System.currentTimeMillis(); 
System.out.println((long)ops / (t1 - t0) + " ops/ms"); 
} 





public static void test(int size) { 
for (int i = 0; i < size; i++) { 
byte b[] = new byte[1024]; 
r.nextBytes(b); 
digest (b); 
} 
} 


public static void digest(byte [] data) { 
algorithm.update (data) ; 
algorithm.digest(); 
OpS++; 
} 
} 


如 果 基 准 测试 的 目标 是 衡量 MDS 算法 的 性 能 ,那么 上 面 的 测试 示例 就 可 算是 个 反面 教材 了 。 
由 于 生产 随机 数据 的 时 间 也 被 统计 在 内 ， 所 以 基准 测试 的 结果 反映 的 是 MDS 算法 和 随机 数 生 成 
算法 两 者 结合 之 后 的 性 能 。 虽 然 这 可 能 是 无 心 的 , 却 使 测试 结果 不 再 可 靠 。 下 面 是 更 加 合理 的 基 
准 测试 代码 。 


import java.util.Random; 
import java.security.*; 













































































public class Md5ThruPutBetter { 
static MessageDigest algorithm; 
static Random r = new Random(); 
static int ops; 
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static byte[][] input; 


public static void main(String args[]) throws Exception { 
algorithm = MessageDigest.getInstance("MD5"); 
algorithm.reset(); 
generatelInput (100000) ; 
long t0 = System.currentTimeMillis(); 
test(); 
long t1 = System.currentTimeMillis(); 
System.out.printlin((long)ops / (t1 - t0) + " ops/ms"); 
} 


public static void generateInput(int size) { 
input = new byte[size]; 
for (int i = 0; i < size; i++) { 
input[i] = new byte[1024]; 
r.nextBytes (input[i]); 
} 
} 


public static void test() { 
for (int i = 0; i < input.length; i++) { 
digest (input [i]); 
} 
} 


public static void digest (byte [] data) { 
algorithm.update (data); 
algorithm.digest(); 
OpS++; 
} 
} 


5.2.2 BRS 


在 根据 基准 测试 的 结果 做 出 结论 之 前 , 大 量 统计 应 用 程序 的 各 个 时 间 指 标 是 非常 重要 的 。 最 
简便 的 方法 是 重复 多 次 执行 测试 程序 , 得 到 多 次 测量 结果 的 标准 差 ， 只 有 当 标 准 差 在 预定 范围 之 
内 时 ， 基 准 测试 的 结果 才 是 真实 有 效 的 。 

应 尽 可 能 在 多 个 同类 机 器 上 多 次 运行 基准 测试 程序 , 这 样 有 助 于 发 现 无 心 的 配置 错误 , 例如 
忘记 了 配置 负载 生成 器 , 导致 基准 测试 的 结果 较 低 等 。 如 果 所 有 的 基准 测试 都 在 同一 台 机 器 上 执 
行 ， 就 难以 发 现 这 种 因 配 置 而 产生 的 错误 。 


5.2.3 ” 微 基准 测试 


微 基 准 测试 只 包含 很 少量 的 代码 ， 只 测试 整个 应 用 程序 的 很 少 一 部 分 功能 ， 例 如 JVM 对 
java.math.BigInteger 实例 做 乘法 的 速度 ,或 者 JVM 执行 AES 加 密 算法 的 速度 。 微 基准 测 
试 易于 编写 ， 只 需要 包含 日 标 功能 或 算法 即 可 。 
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微 基 准 测 试 易 写 好 用 ,在 验证 大 型 应 用 程序 的 性 能 瓶颈 时 往往 可 以 提供 重要 
线索 ， 因 而 成 为 优化 已 知 问题 代码 和 完善 性 能 回归 测试 的 中 坚 力 量 。 
-i 强烈 建议 应 用 程序 的 开发 者 在 做 回归 测试 时 使 用 微 基 准 测 试 ,在 修复 故障 时 
要 进行 单元 测试 ， 这 样 可 以 保证 已 解决 过 的 问题 不 会 再 带 来 麻烦 。 








如 果 大 型 应 用 程序 可 以 简化 为 多 个 微 基准 测试 ， 或 者 是 “小 基准 测试 "， 事 情 会 简单 很 多 。 
但 遗憾 的 是 ， 现 在 应 用 程序 都 太 复杂 ， 很 难 这 样 处 理 。 不 过 ， 通 过 分 析 系 统 行为 ,在 掌握 基本 原 
理 的 基础 上 ， 还 是 可 以 创建 很 多 微 基 准 测试 的 。 例 如 ， 下 面 的 示例 代码 被 用 来 对 JRockit JVM 做 
性 能 回归 测试 。 

public Result testArrayClear (Loop loop, boolean validate) { 

long count = 0; 





























OpsPerMillis t = new OpsPerMillis("testArrayClear"); 
testart); 
loop.start(); 





while (!loop.done()) { 
int[] intArray = new int [ARRAYSIZE]; 
System.arraycopy(this.sourceIntArray, 0, intArray, 0, ARRAYSIZE); 





// 引 入 副作用 
/ /该 调用 会 妨碍 死 代码 提出 优化 ， 也 就 无 法 移 除 整 个 内 存 分 配 操作 
//from removing the entire allocation. 
escape (intArray); 
count++; 
} 
t.end(); 
return new OpsPerMillis(count, t.elapsed()); 


} 

Java 编程 要 求 在 为 对 象 分 配 内 存 后 , 要 将 相应 的 内 存 区 域 清 零 , 这 样 对 象 的 成 员 变量 会 初始 
化 为 默认 值 。 不 过 ， 就 上 面 的 代码 来 说 ，JRockit 中 的 代码 优化 器 应 该 可 以 检测 出 数组 对 象 
initArray 在 创建 之 后 会 立即 被 其 他 数据 完全 填充 ， 而 且 由 于 initarray 不 是 volatile 变 
Ht, 在 分 配 内 存 后 没 必要 执行 清 零 操作 。 如 果 因 为 某 种 原因 而 使 这 样 优 化 执行 失败 , 则 基准 测试 
的 结果 会 反映 出 代码 运行 时 间 变 长 ， 质 量 保证 框架 会 发 出 相应 的 警告 。 
建立 微 基准 测试 应 该 依据 影响 应 用 程序 性 能 的 关键 因素 。 例 如 ， 如 果 要 测试 XML 解析 器 ， 
就 应 该 使 用 各 个 不 同 大 小 的 XML 文件 来 测试 其 执行 性 能 ; 如 果 应 用 程序 使 用 了 java.math. 
BigDecimal 类 ,那么 最 好 能 写 一些 自 包含 的 小 程序 操作 BigDecimal 类 来 测试 一 下 具体 的 性 能 。 

如 果 微 基准 测试 本 身 是 无 效 的 , 或 者 不 能 针对 目标 问题 生成 有 用 的 结果 , 这 就 不 仅仅 是 浪费 
时 间 和 精力 了 , 潜在 的 危害 是 这 些 数 据 会 被 误 认 为 是 准确 的 。 例 如, 在 测试 java.util.HashMap 
类 的 性 能 时 , 光 是 创建 HashMap 的 实例 并 用 数据 填充 是 不 够 的 , 没 法 真实 反映 HashMap 类 的 性 
能 。 当 HashMap 做 扩容 时 ， 重 新 计算 已 有 元 素 哈 希 需要 多 久 ” 获取 元 素 需 要 多 久 ? 不 同 元 素 的 
哈 希 值 冲 突 时 该 如 何 处 理 ? 
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类 似 地 , 在 测试 java.math.BigDecimal 类 的 实现 时 ， 只 执行 加 法 运算 显然 是 不 够 的 。 如 
果 除 法 运算 有 性 能 问题 该 怎么 办 呢 ? 





在 建立 微 基 准 测试 时 , 关键 点 是 要 理解 被 测试 目标 , 要 注意 检查 基准 测试 是 
— 和 否 有 效 ， 以 及 测试 结果 是 否 有 用 。 





上 面 的 两 个 例子 虽 是 有 意 为 之 , 但 仍 说 明 无 效 的 基准 测试 会 使 人 误 入 歧途 。 更 实际 一 点 的 例 
子 是 对 某 个 类 库 中 的 同步 方法 进行 基准 测试 。 如 果 应 用 程序 中 对 同步 操作 的 竞争 非常 激烈 , 那么 
在 做 微 基准 测试 时 ， 显 然 不 应 该 在 单线 程 环境 下 进行 , 大 量 减 少 线程 数 使 负载 降低 会 从 根本 上 改 
变 锁 的 行为 , 这 也 是 使 基准 测试 失效 的 主要 原因 之 一 。 如 果 要 对 同步 操作 进行 基准 测试 ， 就 要 确 
保 其 中 所 有 的 锁 都 处 在 被 大 量 线程 竞争 的 环境 中 。 

最 后 ,要 尽量 剔除 与 目标 问题 无 关 的 代码 ， 以 防止 影响 最 终 的 测试 结果 。 如 果 单纯 想 测试 算 
法 实现 的 执行 性 能 , 那么 创建 大 量 对 象 、 增 加 垃圾 回收 器 的 工作 量 就 显得 完全 没 必 要 了 。 选 择 垃 
圾 回收 策略 时 也 要 选择 不 会 对 算法 执行 产生 不 良 影响 的 垃圾 回收 策略 ( 例如 很 大 的 堆 , 没有 新 生 
代 ， 以 最 大 化 吞吐 量 为 优化 目标 等 )。 

1. 微 基 准 测 试 与 栈 上 替换 

在 做 基准 测试 时 ， 另 一 个 常见 的 错误 就 是 以 为 所 有 的 JVM 都 会 做 栈 上 替换 ( on-stack 
replacement )， 即 方法 可 以 在 执行 时 被 优化 和 替换 。 在 本 书 第 2 章 中 曾经 提 到 过 ,， 耻 ockit 是 不 会 
做 栈 上 蔡 换 的 。 因 此 ， 如 果 基 准 测试 的 主要 工作 都 集中 在 主 函数 的 某 个 循环 体内 ， 那 么 即使 某 
些 方法 已 经 被 标记 为 热 方法 并 已 经 过 优化 编译 了 ， 这 些 优化 编译 后 的 代码 也 可 能 永远 都 不 会 被 
执行 到 。 

下 面 的 示例 代码 中 ， 主 函数 的 循环 体内 包含 了 一 些 复杂 操作 ， 但 在 像 JRockit 这 种 不 使 用 栈 
上 替换 的 JVM 中 ， 对 主 函数 的 优化 编译 永远 不 会 起 作用 。 对 此 的 解决 方法 是 将 那些 复杂 操作 移 
到 单独 的 函数 中 ， 然 后 在 循环 体 中 调用 该 函数 。 

public class BadMicro { 

public static void main(String args[]) { 
long t0 = System.currentTimeMillis(); 
for (int i = 0; i < 1000000; i++) { 
// 复杂 的 基准 测试 
a tl = System.currentTimeMillis(); 
System.out.printlin("Time: " + (t1 - t0) + " ms"); 


} 
} 


2. 微 基 准 测试 与 启动 时 间 

在 第 2 章 中 曾经 提 到 过 ，JVM 的 启动 时 间 的 长 短 取 决 于 加 载 初始 类 和 生成 启动 代码 的 时 间 。 
如 果 基 准 测 试 的 目标 只 是 测量 运行 时 间 ， 那 么 就 要 注意 从 总 体 运 行 时 间 中 排除 启动 时 间 的 干扰 。 
此 问题 的 解决 方法 之 一 就 是 让 基准 测试 执行 足够 多 的 操作 以 降低 启动 时 间 带 来 的 影响 。 
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一 定 要 注意 ， 微 基准 测试 的 执行 时 间 通 常 都 很 得 ， 而 在 这 点 时 间 里 ，JVM 的 启动 时 间 还 占 
去 了 不 少 份额 。 如 果 在 微 基准 测试 中 执行 100 个 浮 点 数 的 乘法 操作 , 那么 总 体 运行 时 间 就 几乎 都 
被 启动 时 间 占 去 了 ; 而 如 果 是 执行 几 万 亿 个 泽 点 数 乘法 操作 , 那 启动 时 间 那 点 份额 就 不 算 什么 了 。 

当然 ,这 与 JVM 的 具体 实现 有 关 ， 像 JRockit 这 种 没有 解释 器 的 JVM， 启 动 速度 会 比 使 用 
了 解释 器 的 JVM 稍 慢 一 些 。 

因此 , 一 定 要 注意 只 有 当 目 标 任 务 真 正 开始 执行 时 才 开始 计时 ,而 不 是 从 执行 主 函数 开始 就 
计时 。 类 似 地 ， 使 用 外 部 程序 来 统计 Java 程序 的 执行 时 间 时 ， 统 计 结 果 中 也 包含 了 JVM 的 启动 
时 间 ， 分 析 统 计 结 果 时 要 多 加 小 心 。 
































| 在 微 基 准 测 试 中 ， 某 些 情况 下 启动 时 间 也 是 需要 测量 的 相关 量 。 ] 


下 面 的 示例 代码 本 意 是 想 测试 加 法 操作 的 执行 效率 , 但 由 于 加 法 操作 的 次 数 太 少 , 其 执行 时 5 
间 远 远 短 于 JVM 的 启动 时 间 ， 测 试 结果 是 无 效 的 。 


import java.util.Random; 





public class AnotherBadMicro { 


static Random r = new Random(); 
static int sum; 


public static void main(String args[]) { 
long t0 = System.currentTimeMillis(); 
int s = 0; 
for (int i = 07 2 < 1000; a+4) { 
s += r.nextInt(); 


} 


sum = sS; 
long t1 = System.currentTimeMillis(); 
System.out.println("Time: " + (t1 - t0) + " ms"); 


} 
} 


5.2.4 测试 前 热身 


不 同 的 JVM 实现 中 可 能 会 使 用 不 同 的 优化 策略 ， 因 此 ， 在 开始 实际 测试 之 前 ， 先 让 代码 做 
做 “热身 运动 "， 可 以 使 测试 结果 更 准确 。“ 热 身 ” 可 以 使 JVM 得 到 试 运行 目标 代码 的 反馈 信息 ， 
执行 相关 优化 ， 从 而 使 JVM 在 真正 开始 测试 时 可 以 处 于 经 过 优化 的 稳定 状态 。 

很 多 工业 级 标准 的 基准 测试 工具 中 ， 例 如 在 本 章 后 面 小 节 中 会 提 到 的 SPECjvm2008， 都 内 
建 了 对 目标 任务 “热身 ”的 操作 。 
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5.3 ”确定 测试 目标 


基准 测试 的 测试 目标 取决 于 目标 应 用 程序 的 具体 类 型 ， 需 要 依 实际 情况 来 确定 。 








5.3.1 Fits 


测试 以 吞吐 量 为 优化 目标 的 应 用 程序 相对 来 说 会 容易 一 些 , 测试 时 需要 注意 的 是 在 给 定 的 周 
期 内 尽 可 能 多 地 执行 应 用 程序 的 具体 操作 。 作 为 回归 测试 使 用 时 , 基准 测试 需要 验证 在 基线 硬件 
(baselined hardware) 上 ， 应 用 程序 是 否 仍旧 可 以 在 y 秒 内 执行 x 个 操作 。 如 果 满 足 条 件 ， 继 续 
测试 是 否 可 以 维持 住 吞吐 量 。 

正如 第 3 章 提 到 的 , 吞吐 量 本 身 通常 不 是 什么 大 问题 ( 除非 是 在 批 处 理 任 务 和 离线 分 析 场 景 
下 )， 写 一 个 用 来 测试 乔 吐 量 的 基准 测试 也 不 是 什么 难事 ， 一 般 来 说 可 以 直接 从 主 应 用 程序 中 抽 
取出 来 ， 无 须 使 用 什么 技巧 。 
















































































5.3.2 ”兼顾 吞吐 量 、 响 应 时 间 和 延迟 


一 般 来 说 ,前面 提 到 的 以 吞吐 量 为 目标 的 基准 测试 可 以 被 改进 为 , 用 于 测量 在 给 定 的 响应 时 
间 范 围 内 的 吞吐 量 。 

如 果 为 基准 测试 限制 了 固定 的 响应 时 间 , 那么 也 就 加 上 了 延迟 这 个 限制 因素 。 该 基准 测试 可 
用 来 验证 应 用 程序 在 预 设 的 响应 时 间 范 围 内 ， 是 否 可 以 稳定 运行 于 不 同 的 工作 负载 下 。 























JRockit 质量 保证 团队 内 部 使 用 的 基准 测试 套件 中 ， 包 含 很 多 附加 了 响应 时 
间 要 求 的 吞吐 量 基准 测试 工具 。 这 些 工 具 用 来 验证 确定 式 垃圾 回收 器 在 不 同 的 工 
作 负 载 下 是 否 可 以 满足 任务 需要 。 





对 大 多 数 用 户 来 说 ， 低 延迟 通常 比 高 否 吐 更 重要 ， 人 至 少 在 C/S 架构 的 程序 中 是 这 样 的 , 编写 
以 低 延 迟 为 目标 的 基准 测试 会 更 具 挑战 性 。 











一 般 情况 下 ， 简 单 的 Web 应 用 程序 的 响应 时 间 会 在 1 秒 左 右 ， 而 在 金融 行 

业 ， 普 遍 要 求 应 用 程序 暂停 时 间 要 小 于 10 毫秒 。 类 似 地 ， 在 电信 行业 ， 通 常 要 

S 求 应 用 程序 的 暂停 时 间 要 小 于 50 毫秒。 用户 和 JVM 厂商 为 了 满足 低 延 迟 要 求 需 
要 做 大 量 细致 的 基准 测试 。 


5.3.3 ”伸缩 性 


针对 伸缩 性 的 基准 测试 主要 是 测量 相关 资源 的 利用 率 。 良 好 的 伸缩 性 意味 着 随 着 工作 负载 的 
上 升 ， 应 用 程序 依然 运行 稳定 。 如 果 应 用 程序 的 伸缩 性 不 好 , 说明 其 无 法 充分 利用 硬件 资源 , 结 
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果 往 往 会 导致 否 吐 量 下 降 。 理想 情况 下 , 线性 增长 的 工作 负载 最 多 只 会 使 应 用 程序 的 性 能 和 服务 
质量 线性 下 降 。 

下 图 是 每 个 CPU 核心 上 伸缩 性 呈 近 似 线性 变化 的 例子 ， 其 中 吞吐 量 是 通过 在 老 版 本 JRockit 
JVM 上 运行 SPECjbb2005 基准 测试 得 出 的 。SPECjbb2005 是 一 个 多 线程 基准 测试 程序 ， 会 在 一 
个 事务 处 理 框架 中 逐步 增 大 工作 负载 。 



































SPECjbb2005 on x86 64 


一 “一 BEA JRockit 5.0 R26.4 
--a--- BEA JRockit 5.0 R26.3 








核心 数量 


SPECjbb 在 进行 基准 测试 时 一 开始 使 用 的 工作 线程 数 会 少 于 CPU 核心 数 ， 然 后 随 着 测试 的 
进行 增加 工作 线程 的 数量 ， 进 而 增 大 应 用 程序 的 知 吐 量 。 有 点 像 增 量 式 热身 。 从 图 中 可 以 看 出 ， 
开始 的 时 候 ， 增 加 工作 线程 数 使 目标 应 用 程序 的 否 吐 量 呈 线性 增长 ， 直 到 工作 线程 的 数量 等 于 
CPU 核心 数 , 这 时 甜 吐 量 已 成 饱和 状态 。 此 后 ,再 继续 增加 工作 线程 数 , 知 吐 量 也 不 会 继续 呈 线 
性 提升 了 ， 而 是 保持 在 某 一 水 平 直 到 测试 结束 。 这 就 是 说 ， 该 应 用 程序 在 伸缩 性 方面 做 得 不 错 。 
本 章 后 面 的 小 节 会 详细 介绍 SPECjbb。 

就 上 面 的 测试 结果 来 说 ， 目 标 应 用 程序 在 指定 JVM 上 具有 不 错 的 伸缩 性 。 简 单 来 说 就 是 ， 
如 果 数 据 量 增 大 ,只 需要 增加 更 多 的 硬件 设备 就 可 以 了 。 保持 伸缩 性 涉及 应 用 程序 层面 的 算法 实 
现 ， 以 及 JVM 和 操作 系统 层面 如 何 应 对 新 增 的 工作 负载 等 方面 ， 具 体 包 括 网 络 拥堵 、CPU 周期 
以 及 并 行 执行 的 线程 数 等 。 



















































































尽管 良好 的 伸缩 性 是 最 理想 的 优化 目标 , 它 意味 着 应 用 程序 能 够 最 大 化 地 发 

挥 出 硬件 的 潜能 。 但 从 实践 应 用 来 看 ， 优 化 某 些 理论 上 具有 上 千 个 CPU 核心 的 

一 机 器 只 是 做 无 用 功 而 已 ,对 整体 伸缩 性 的 过 分 追求 反而 可 能 会 有 降低 应 用 程序 性 
能 的 风险 。 
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5.3.4 电力 消耗 


以 往常 常 被 忽视 的 电力 消耗 (power consumption ) 测试 现在 正 变 得 越 来 越 重 要 。 电 力 消 耗 的 
重要 性 不 仅仅 体现 在 能 人 式 领 域 ， 当 服务 器 集群 足够 大 时 ， 电 力 消 耗 也 将 成 为 重要 的 影响 因素 。 
由 于 存在 冷却 成 本 和 服务 器 基础 架构 等 问题 , 电力 消耗 愈 发 凸显 其 重要 性 ,因为 它 直接 关系 到 数 
据 中 心 所 需 空间 的 大 小 。 为 了 更 好 地 利用 现 有 人 硬件， 业界 已 广泛 采用 虚拟 化 技术 ， 即 便 如 此 , 在 
应 用 程序 层面 对 电力 消耗 做 基准 测试 也 还 是 很 有 必要 的 。 

降低 应 用 程序 的 电力 消耗 会 涉及 多 方面 内 容 ， 例 如 用 操作 系统 线程 的 锁 替 换 自 旋 锁 以 节省 
CPU 消耗 ， 或 者 减少 操作 系统 和 应 用 程序 之 间 的 数据 转移 等 等 。 

对 此 ， 一 个 颇具 主动 性 的 解决 办 法 是 ， 在 开发 阶段 想 办 法 使 应 用 程序 在 低 主 频 的 CPU E, 
或 者 只 使 用 部 分 CPU 核心 时 也 能 满足 性 能 要 求 。 



















































































5.3.5 ”其 他 问题 


当然 ,在 对 应 用 程序 的 性 能 做 基准 测试 时 , 还 有 一 些 其 他 方面 的 问题 需要 考虑 , 需要 根据 应 
用 程序 自身 的 特点 选择 不 同类 型 的 测试 。 有 时 候 ， 光 是 量化 “性 能 ”就 足够 让 人 头疼 了 。 














5.4 工业 级 基准 测试 


这 些 年 来 ， 工 业界 与 学 术 界 一 直 致 力 于 能 模拟 出 Java 应 用 程序 可 能 会 遇 到 的 各 种 问题 的 通 
用 基准 测试 。 对 此 ，JVM 厂商 和 硬件 厂商 当然 举 双手 赞成 ， 因 为 这 不 但 可 以 提升 JVM 的 运行 效 
率 ， 还 有 利于 产品 推广 。 标 准 化 的 基准 测试 通常 会 涉及 与 JVM 调 优 相 关 的 一 些 细 节 。 为 了 能 够 
更 好 地 理解 在 不 同 的 场景 下 应 如 何 使 用 JVM， 建 议 开发 人 员 查 看 一 下 针对 相关 问题 的 基准 测试 
报告 。 

自然 地 ， 基 准 测试 延展 到 了 与 编程 相关 的 方方面面 ,很 多 软件 栈 都 遵循 性 能 测量 标准 。 组 织 
发 布 了 从 应 用 程序 服务 器 到 网 络 库 等 各 种 基准 测试 ， 对 于 Java 开发 人 员 来 说 ， 选 择 并 使 用 相关 
的 基准 测试 也 是 一 种 相关 的 练习 。 







































































。 得 更 好 ， 所 以 本 节 中 重点 介绍 JVM 厂商 常用 的 几 种 基准 测试 套件 。 在 之 前 的 章 
节 中 已 经 介绍 了 优化 JVM 对 不 同类 型 应 用 程序 的 影响 ， 良 好 的 基准 测试 可 以 准 
确 反映 出 应 用 程序 在 实际 运行 时 的 执行 性 能 。 本 节 所 提 到 的 一 些 基准 测试 套件 ， 


本 节 会 以 JVM 为 中 心 介绍 基准 测试 。JVM 的 开发 者 自然 希望 相关 配置 运行 
例如 SPECjAppServer， 同 样 可 以 作为 通用 基准 测试 应 用 于 更 大 型 的 软件 栈 。 
5 


.4.1 SPEC 基准 测试 套件 


SPEC ( standard performance evaluation corporation ) 是 一 个 非 营利 性 组 织 ， 开 发 并 维护 着 多 
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种 基准 测试 套件 。 这 些 套件 可 用 于 测试 运行 在 现代 硬件 架构 上 的 各 类 应 用 程序 的 性 能 。 本 节 将 简 
要 介绍 其 中 与 Java 相关 的 几 种 基准 测试 套件 。 

本 节 提 到 的 几 种 SPEC 基准 测试 套件 中 ,除了 SPECjvm2008 套件 之 外 ， 其 他 都 是 需要 付 
费 的 。 

1. SPECjvm 基准 测试 套件 

SPECjvm 的 第 一 个 发 行 版 是 1998 年 的 SPECjvm98， 其 设计 初衷 是 测量 JVM 和 IRE 的 执 
行 性 能 ， 目 前 该 版 本 已 经 下 线 。SPECjvm98 是 一 个 单线 程 的 、 绑 定 CPU 的 基准 测试 套件 ， 它 
确实 可 以 反映 出 JVM 代码 优化 的 质量 ， 但 也 仅 此 而 已 。 几 年 之 后 ，SPECjvm98 就 因 其 过 小 的 
工作 对 象 集合 ( object working set ) 再 也 无 法 承担 起 对 现代 JVM 进行 基准 测试 的 任务 了 。 
SPECjvm98 套件 中 包含 了 一 些 简单 的 测试 用 例 ， 例 如 压缩 、MP3 解码 ， 以 及 对 javac 编译 器 的 
性 能 测试 等 。 

SPECjvm 目前 的 版 本 是 SPECjvm2008， 是 SPECjvm98 的 改进 版 ,在 其 基础 上 添加 了 一 些 新 
的 基准 测试 用 例 ， 增 大 了 工作 负载 ， 并 且 可 应 用 于 多 核 平 台 。 此 外 ， 它 还 可 以 测试 JVM 的 一 些 
指标 ， 例 如 JVM 启动 时 间 和 锁 的 执行 性 能 。 

近来 ,为 了 更 好 地 测试 , SPEC 组 织 又 在 SPECjvm 中 添加 了 一 些 新 的 应 用 程序 , 例如 对 Derby 
数据 库 和 加 密 框架 的 支持 ， 此 外 ， 强 调 对 应 用 程序 热身 ， 在 稳定 状态 下 测试 性 能 。 
久负盛名 的 科学 计算 基准 测试 套件 SciMark 已 被 集成 到 SPECjvm2008 中 。 在 之 前 单独 发 行 
的 SciMark 套件 中 , 由 于 并 非 所 有 JVM 实现 都 支持 OSR, 所 以 不 同 JVM 之 间 的 测试 结果 不 具 可 
比 性 。 这 个 问题 在 SPECjvm2008 已 经 得 以 解决 。 

2. SPECjAppServer 套件 和 SPECjEnterprise2010 套件 

SPECjAppServer 是 一 个 相当 复杂 的 基准 测试 套件 , 安装 起 来 也 很 麻烦 , 但 同时 , 它 也 非常 出 色 。 
它 的 前 身 是 ECPerf， 经 过 SPECjAppServer2001、SPECjAppServer2002 和 SPECjAppServer2004 这 
几 个 版 本 的 发 展 ， 其 最 新 版 本 已 更 名 为 SPECjEnterprise2010。 

该 基准 测试 套件 的 基本 思想 是 在 尽 可 能 多 的 软 硬 件 平台 上 运行 一 个 典型 的 JEE 应 用 程 
序 ， 该 REE 应 用 程序 会 模拟 汽车 经 销 商 与 生产 商 之 间 的 交互 ， 以 Web 浏览 器 模拟 经 销 商 与 
生产 商 之 间 的 对 话 ， 库 存 和 交易 数据 保存 在 数据 库 中 ， 生 产 过 程 用 RMI 操作 来 模拟 。 此 外 ， 
SPECjEnterprise2010 还 在 基准 测试 中 引入 了 Web Service 和 其 他 一 些 Java EE 5.0 版 本 中 的 
功能 。 

SPECjAppServer 套件 不 仅仅 可 用 来 对 JVM 进行 基准 测试 ， 还 可 以 测试 服务 器 硬件 、 网 络 交 
换 机 和 某 个 具体 的 应 用 程序 服务 器 等 的 性 能 ， 会 在 给 出 测试 分 数 时 提供 完整 的 软 硬 件 调 用 栈 信 
息 。 就 基准 测试 套件 来 说 ，SPECjAppServer/SPECjEnterprise2010 非常 出 色 ， 可 以 对 系统 的 每 一 
个 部 分 进行 性 能 测试 , 这 对 每 个 开发 者 来 都 是 具有 重要 意义 的 。 值 得 注意 的 是 ， 基 准 测试 的 目标 
对 象 是 J2EE 应 用 程序 的 中 间 层 ， 而 不 是 数据 库 或 数据 生成 程序 。 

该 基准 测试 套件 安装 复杂 (不 过 理论 上 只 需要 安装 一 次 )， 难 以 调试 ， 可 以 在 单 台 机 器 上 以 
自 包 含 的 形式 运行 ， 但 这 么 干 有 点 浪费 资源 ， 而 且 所 得 到 的 结果 也 不 具 说 服 力 。 

一 般 情况 下 ,基准 测试 需要 有 一 个 包含 了 网 络 架 构 、 应 用 程序 服务 器 和 数据 库 服务 器 等 组 件 
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的 待 测试 系统 (system under test )， 见 下 图 ， 这 些 组 件 分 别 会 位 于 不 同 的 物理 机 器 上 ， 然 后 通过 
位 于 测试 系统 外 部 的 驱动 器 (driver ) 来 添加 工作 负载 。 本 章 前 面部 分 介绍 的 示例 就 是 以 这 种 方 
式 工作 的 。 相 比 于 之 前 的 版 本 ，SPECjEnterprise2010 套件 的 一 大 改进 就 是 大 幅 降低 了 数据 库 负 载 
所 带 来 的 影响 ， 以 便 更 准确 地 测 出 其 他 部 分 的 性 能 指数 。 

在 完整 的 测试 环境 中 ,每 一 个 部 分 的 性 能 对 测试 结果 都 很 重要 ， 从 网 络 交 换 机 到 RAID 方案 
等 .对 于 JVM 性 能 测试 来 说 , SPECjAppServer 是 非常 出 色 的 基准 测试 套件 , 它 涵盖 了 大 量 的 Java 
代码 ， 可 以 跟踪 调用 栈 执行 代码 分 析 ， 而 不 会 产生 额外 的 “ 热 方法 ”。 在 这 里 为 了 能 让 JIT 编译 
器 准确 地 完成 内 联 操作 ，SPECjAppServer 对 其 做 了 细致 的 设 定 。 


待 测试 系统 












































| 应 用 程序 服务 器 
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就 SPECjAppServer2004 来 说 ， 为 了 能 够 成 功 运行 基准 测试 ,使 用 TxRate (transaction rate ) 
来 表示 测试 过 程 中 可 承载 的 工作 量 。 该 数值 随 测试 过 程 中 工作 负载 的 增加 而 增加 ， 当 基准 测试 程 
序 因 工作 负载 过 大 而 以 失败 告终 时 ， 即 可 确定 出 TxRate 的 最 大 值 ， 该 值 可 用 于 计算 基准 测试 的 
最 终 得 分 。 

新 近 版 本 的 基准 测试 套件 做 了 很 多 改进 , 应 用 程序 服务 器 使 用 了 更 新 的 标准 , 为 适应 新 的 硬 
件 架 构 而 增加 了 工作 负载 ， 提 供 了 对 多 应 用 程序 和 多 驱动 器 (multiple driver machine ) 的 支持 ， 
性 能 测试 也 更 加 准确 。 

3. SPECjbb 套件 

SPECjbb 可 能 是 现今 使 用 最 广泛 的 Java 基准 测试 之 一 , 广泛 应 用 于 学 术 研 究 领 域 , 并 且 已 经 
成 为 三 大 虚拟 机 厂商 ( Oracle、IBM 和 Sun) 的 一 个 竞争 点 ， 而 且 这 三 大 厂商 还 与 硬件 厂商 密切 
合作 ， 轮 流 刷 新 着 SPECjbb 的 世界 纪录 。 

SPECjbb 目前 已 发 展 出 了 2 个 版 本 ， 分 别 是 SPECjbb2000 (已 停 用 ) 和 SPECjbb2005 ( 仍 在 
使 用 )。 与 SPECjAppServer 类似，SPECjbb 也 是 从 多 个 层次 来 模拟 事务 处 理 流 程 ， 但 只 通过 一 个 
自 包 含 的 、 运 行 在 一 台 物 理 服 务 器 上 的 应 用 程序 来 执行 。 

SPECjbb 基准 测试 套件 对 JVM 的 性 能 优化 做 出 了 很 多 贡献 ,尤其 是 在 代码 生成 方面 推动 
了 很 多 成 果 的 产 出 ， 此 外 ，SPECjbb 打分 系统 对 垃圾 回收 和 锁 性 能 方面 的 要 求 也 有 助 于 技术 
进步 。 
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下 面 是 JRockitJVM 中 直接 影响 SPECjbb 基准 测试 得 分 的 几 个 功能 点 和 优化 
点 , 实际 上 还 有 一 些 会 影响 到 系统 性 能 的 因素 没 在 这 里 列 出 ,。 这些 功能 点 都 提升 
了 应 用 程序 的 实际 执行 性 能 : 
延迟 解锁 (偏向 锁 ) 
寸 象 预 抓 取 算 法 
寺 大 内 存 页 的 支持 
二 非 连续 堆 的 支持 
才 数 组 操作 的 优化 ， 例 如 对 System.arraycopy 方法 的 具体 实现 、 内 
AP BM AR, BAAS ILA m AAE 
THEIR ADH HD HAF 


Oooco 
4 St R 


kay 
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kay 

















SPECjbb 的 一 个 缺点 是 硬件 依赖 性 过 于 严重 ， 受 内 存 限制 较 大 , 单单 是 把 运行 环境 切换 到 组 
存 稍 大 的 工 2 硬件 上 就 会 使 执行 性 能 大 幅 提升 。 

SPECjbb 的 另 一 个 缺点 是 测试 过 程 有 可 能 只 关注 了 吞吐 量 这 一 方面 。 在 SPECjbb 基 准 测试 中 ， 
偶尔 暂停 应 用 程序 的 执行 ,并 开始 执行 并 行 垃 圾 回收 ,直到 清理 完整 个 堆 ， 这样 的 运行 模式 会 在 
测试 中 得 到 较 高 的 分 数 。 

SPECjbb2005 还 可 作为 SPECpower_ssj2008 基准 测试 的 简化 版 使 用 ,它们 使 用 相同 的 事务 处 
理 代 码 ， 区 别 在 于 SPECpower_ssj2008 使 用 了 外 部 的 驱动 器 来 执行 。SPECjbb2005 可 以 量化 表示 
在 不 同 的 系统 负载 下 ， 每 瓦特 电力 所 能 完成 的 事务 数 ， 算 是 对 电力 消耗 的 简单 测试 。 












































这 里 说 说 关于 基准 测试 的 趣事 , 有 时 候 , 性 能 优化 仅仅 是 为 了 讨 基准 测试 的 
欢心 ， 对 应 用 程序 的 实际 运行 没什么 帮助 。 例 如 ， 在 JRockit P, System. 
currentTimeMillis 方法 是 一 个 本 地 方法 , 调用 该 方法 会 返回 自 1970 年 1 月 1 
日 以 来 的 毫秒 数 。 由 于 这 个 方法 涉及 操作 系统 层面 的 系统 调用 或 特权 操作 , 频繁 
调用 该 方法 会 降低 应 用 程序 性 能 。 

事实 上 ， 在 SPCjbb2000 基准 测试 中 包含 不 少 对 System.currentTimeMillis 
方法 的 调用 。 在 某 些 操作 系统 中 (例如 Windows 和 Solaris), 可 以 有 其 他 的 方法 快 

速 获取 系统 时 间 ， 但 在 Linux 上 却 没有 这 样 的 方法 。 在 Linux Ł, JRockit 自己 维 
护 了 一 个 基于 信号 机 制 的 计时 器 , 使 用 专门 的 线程 来 捕获 操作 系统 每 隔 10 SAY 
生 一 次 的 信号 ， 当 捕获 到 信号 后 ， 就 将 本 地 的 时 间 计 数 器 增加 10 毫秒。 这 种 实现 
方式 使 计时 器 准确 性 逊 于 系统 计时 器 , 但 只 要 不 出 现 故障 ( 例如 计时 器 数值 变 小 )， 
就 不 违反 Java 语义， 还 可 以 提升 SPECjbb 基准 测试 的 运行 性 能 。 

今天 ，Linux 平台 上 的 JRockit 已 经 禁用 了 这 种 计时 器 实现 ， 如 果 读 者 出 于 某 种 
需要 而 无 法 忍受 System.currentTimeMillis 方法 所 带 来 的 性 能 损耗 , 可 以 通过 
命令 行 参 数 -Xx:UseSafeTimer-true 来 启用 它 , 不 过 目前 还 没有 看 到 这 样 的 案例 。 
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5.4.2 SipStone 基准 测试 


SipStone 包含 了 一 整套 完整 的 基准 测试 套件 ， 提 供 了 对 SIP 协议 (session initiation protocol, 
会 话 发 起 协议 ) 实现 的 基准 测试 功能 ， 和 常用 于 电信 行业 。 

该 基准 测试 套件 模拟 了 真实 电信 场景 的 测试 环境 。 其 中 SP 服务 器 供应 商 常 用 来 测试 SP 应 
用 程序 的 是 Proxy200， 它 为 测试 SIP 应 用 程序 的 性 能 提供 了 完整 的 标准 化 代理 支持 。 









































5.4.3 DaCapo 基准 测试 


DaCapo 是 由 名 为 DaCapo 的 学 术 组 织 ( 该 组 织 专 注 于 JVM 和 运行 时 的 研究 ) 建立 的 一 个 免 
费 的 基准 测试 套件 ， 其 关注 点 更 多 集中 在 垃圾 回收 负载 和 现代 Java 应 用 程序 。 

该 基准 测试 套件 中 包括 解析 器 生成 器 、 字 节 码 优化 器 、 基 于 Java 的 Python 解释 器 ， 以 及 
一 些 供 Eclipse 使 用 的 非 GUI 单元 测试 。DaCapo 使 用 简单 ， 可 对 典型 Java 应 用 程序 做 性 能 压 
力 测 试 。 


5.4.4 真实 场景 下 的 应 用 程序 


收集 一 些 能 够 模拟 真实 场景 的 应 用 程序 用 于 基准 测试 是 很 有 用 的 。 例 如 ， 对 于 Java Web 服 
务 器 的 开发 者 来 说 ， 在 基准 测试 中 集成 多 种 Web 服务 器 软件 能 使 自己 的 作品 保持 竞争 优势。 

我 和 其 他 JVM 开发 者 在 开发 JRockit 时 , 会 在 客户 的 授权 下 使 用 可 能 引起 性 能 问题 的 应 用 程 
序 对 JRockit 进行 基准 测试 。 这 种 方式 使 开发 者 能 够 更 好 地 理解 性 能 问题 ， 而 且 可 以 避免 开发 过 
程 中 性 能 下 降 。 这 些 应 用 程序 已 经 集成 到 基准 测试 中 , 每 天 或 每 周 都 会 执行 一 次 基准 测试 ， 更 小 
的 基准 测试 可 以 执行 得 更 频繁 一 些 。 



























































对 于 开发 团队 来 说 , 测试 产品 的 平台 适用 性 很 有 意思 而 且 也 有 用 , 开发 者 会 
花 好 几 天 将 产品 部 署 到 所 有 可 支持 的 平台 上 ,这 有 助 于 找 出 隐藏 的 故障 和 性 能 问 
题 。 要 找 出 JVM 或 编译 器 的 适用 平台 并 不 困难 ， 但 针对 特殊 平台 仍 有 很 多 测试 
工作 要 做 。 此 外 ,负载 生成 器 、 网 络 测试 工具 和 其 他 平台 无 关 的 产品 可 用 来 对 应 
用 程序 进行 压力 测试 。 




















我 建议 在 做 基准 测试 的 时 候 要 准备 足够 多 的 测试 实例 , 例如 , 如 果 是 要 开发 PEE 应 用 程序 ， 
就 将 之 部 署 在 多 个 应 用 程序 服务 器 上 运行 ;如 果 是 开发 一 个 数学 计算 库 ， 就 在 多 种 JVM 上 调用 
java.lang.math 包 中 相关 类 的 实现 等 。 存 储 空间 不 值钱 ， 所 以 一 定 要 留 下 所 有 相关 日 志 信 息 。 
记 住 ,测试 ， 基 准 测试 ， 调 优 ， 再 测试 ， 如 此 往复 。 
























































5.5 基准 测试 的 潜在 风险 


有 时 , 开发 者 往往 过 于 注重 某 项 基准 测试 结果 ,因而 以 俩 概 全 , 无 法 根据 基准 测试 的 完整 结 
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果 得 出 正确 的 结论 。 

目前 ， 可 供 选择 的 工业 级 基准 测试 工具 很 多 , 用 户 群 庞大 ， 从 硬件 三 商 到 学 术 研 究 者 都 可 以 
用 它们 提升 运行 时 环境 和 应 用 程序 的 执行 性 能 。 给 定 配置 下 得 到 基准 测试 的 结果 后 , 得 出 的 结论 
会 产生 广泛 的 影响 。 

当然 ， 如 果 某 个 主流 的 基准 测试 套件 使 用 过 于 普遍 的 话 ， 那么 就 要 小 心 了 。 典 型 的 例子 就 是 
SPECjvm 基准 测试 套件 和 后 来 出 现 的 SPECjbb 基准 测试 套件 。 

如 果 学 生 可 以 在 电脑 上 用 简单 的 命令 来 运行 基准 测试 的 话 ， 那 肯定 有 助 于 基准 测试 的 推广 ; 
但 如 果 运 行 很 麻烦 的 话 , 就 不 太 妙 了 。SPECjbb 可 以 通过 简单 的 命令 来 运行 , 而 SPECjAppServer 
就 不 能 这 么 干 。SPECjAppServer 本 身 是 非常 出 色 的 基准 测试 套件 ， 几 乎 可 对 应 用 程序 的 每 个 部 
分 进行 测试 ， 从 应 用 程序 服务 器 到 物理 网 卡 ， 无 所 不 包 ， 但 运行 SPECjAppServer 需要 很 多 硬件 
支持 ， 而 且 安装 配置 也 挺 复杂 ， 所 以 在 学 术 领 域 几乎 没 人 用 SPECjAppServer 套件 ， 而 是 普遍 使 
用 SPECjbb 套件 ， 尽 管 这样 的 基准 测试 结果 可 能 不 太 全 面 。 






















































































5.6 性 能 调 优 


在 将 基准 测试 集成 到 测试 框架 后 , 每 当 应 用 程序 可 以 在 可 控 环境 下 稳定 运行 , 或 因 修 改 算法 
实现 而 构建 了 一 个 小 版 本 时 ， 就 应 该 执行 回归 测试 ， 以 保证 即使 修改 了 代码 ， 也 不 会 出 现 性 能 
降 的 情况 。 

执行 基准 测试 的 另 一 个 目的 是 提供 一 个 小 的 、 自 包含 的 沙 箱 , 在 这 个 沙 箱 中 可 以 对 应 用 程序 
的 某 一 部 分 进行 性 能 调 优 ， 以 期 可 以 达到 软件 项 目 预定 的 性 能 目标 。 

在 某 些 案例 中 , 基准 测试 的 结果 表明 , 应 用 程序 某 些 模块 需要 彻底 重 写 ， 以 便 使 用 执行 效率 
更 高 的 算法 ， 而 在 男 一 些 案例 中 ， 只 需要 调整 JVM 的 参数 即 可 满足 要 求 。 


5.6.1 非 规范 化 行为 


在 之 前 章节 中 已 经 提 到 过 ， 自 适应 运行 时 的 反馈 信息 对 JVM 优化 有 着 至 关 重 要 的 作用 。 

理想 情况 下 , 使 用 了 自 适应 运行 时 的 系统 应 该 是 根本 不 需要 调 优 的 , 自 适应 运行 时 应 该 会 根 
据 反馈 信息 适时 地 调节 应 用 程序 的 行为 。 但 可 惜 的 是 , 机 器 的 推 呆 能 力 还 没有 强大 到 可 以 和 人 相 
比 的 地 步 ， 尽 管 它 在 查找 热 方法 和 膨胀 〈 收 缩 ) 锁 等 方面 比 人 工 操作 强 , 但 在 其 他 一 些 方面 就 力 
不 从 心 了 。 壁 如 说 ,如 果 应 用 程序 可 用 的 堆 够 大 的 话 ,根本 就 不 需要 缩放 堆 内 存 , 或 者 如 果 不 关 
心 内 存 碎 片 问题 , 那么 就 不 需要 执行 堆 整 理 的 操作 等 ， 自 适应 运行 时 无 法 推测 出 这 些 内 容 , 需要 
由 开发 人 员 专 门 对 JVM 进行 配置 。 另 一 方面 ， 如 果 开 发 人 员 高 估 了 自己 的 水 平 或 者 没有 掌握 足 
够 的 信息 的 话 ， 就 可 能 会 做 出 错误 的 配置 。 

应 用 程序 的 行为 应 该 通过 专门 的 分 析 器 来 收集 ， 就 JRockit 来 说 ， 它 使 用 了 非 侵 入 性 的 行为 
收集 器 ， 以 较 小 的 性 能 损耗 来 记录 应 用 程序 的 行为 ,根据 这 些 行为 记录 可 以 做 离线 分 析 ， 避 免 影 
响应 用 程序 的 正常 运行 。 
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在 调 优 应 用 程序 之 前 , 首先 要 明确 应 用 程序 的 性 能 瓶颈 在 哪里 , 花 大 力气 去 优化 非 瓶 贷 的 代 
人 码 是 不 值得 的 ， 而 且 还 会 增加 代码 的 复杂 度 。 例 如 ,通过 JRockit Flight Recorder 套件 发 现 应 用 程 
序 的 性 能 瓶颈 是 网 络 处 理 能 力 不 足 ,这 种 情况 下 ,匆忙 将 十 几 行 的 算法 换 成 百 十 来 行 的 “高 端 算 
法 ”是 很 不 明智 的 。 为 了 避免 引入 不 必要 的 复杂 性 ， 应 该 优先 解决 影响 最 大 的 问题 

在 某 些 案例 中 , 在 做 完 应 用 程序 分 析 后 发 现 根 本 不 需要 修改 应 用 程序 ， 从 分 析 结果 看 ， 调整 
运行 时 参数 即 可 解决 问题 。 在 介绍 相关 命令 行 参数 之 前 , 需要 强调 的 一 点 是 , 调 优 所 涉及 的 很 多 
参数 和 JVM 的 行为 都 是 各 大 JVM 厂商 自 定义 的 、 非 规范 化 的 。 就 JRockit 来 说 ， 每 个 新 版 本 都 
会 对 这 些 特性 进行 大 量 优化 , 以 便 更 好 地 满足 用 户 对 应 用 程序 执行 性 能 的 要 求 , 使 用 户 可 以 专注 
于 自身 的 业务 逻辑 开发 。 



































最 后 强调 一 下 ， 通 过 命令 行 参数 自行 配置 JVM 的 运行 4 了 为 可 能 会 产生 意料 

ae 之 外 的 结果 ， 此 外 ， 同 一 款 JV ee 命令 行 参数 的 支持 可 能 也 不 

尽 相 同 ， 使 用 应 多 加 小 心 。 在 JRockit 中 ， 以 -XX pee ees: 
可 能 会 在 不 同 的 版 本 之 间 发 生变 化 ， 使 用 时 要 注意 查看 相关 文档 的 说 明 。 


5.6.2 Watt tr 


正如 在 第 3 章 中 提 到 的 ， 无论 JVM 中 所 运行 的 是 何 种 应 用 程序 ， 调 优 工作 都 是 一 样 的 ， 
调 优 的 基本 目标 大 致 可 分 为 高 吞吐 量 、 低 延迟 或 近 实 时 ， 其 中 ,， 近 实时 可 算 作 是 低 延 迟 的 高 级 
特例 。 

在 前 几 章 中 已 经 介绍 过 这 几 个 优化 目标 , 本 节 将 简单 介绍 其 中 所 涉及 的 一 些 命令 行 参数 , 讲 
解 内 容 只 针对 TRockit, 其 他 JVM 实现 内 部 原理 超出 本 书 范围 , UEDA RL IB 尽管 不 同 JVM 版 
本 对 同一 命令 行 参数 的 定义 可 能 有 所 区 别 ， 但 其 所 涉及 的 基本 原理 和 技术 却 是 相同 的 。 

在 使 用 命令 行 参数 之 前 , 一 定 要 先 查 询 JRockit 文档 , 尤其 是 JRockit 诊断 指南 ， 明 确 所 要 使 
用 的 命令 行 参数 的 具体 作用 。 此 外 可 以 通过 JRockit Mission Control 套件 记录 使 用 该 参数 前 后 应 
用 程序 的 行为 来 加 深 对 该 参数 的 理解 。 

为 了 避免 篇 幅 过 长 ， 本 节 中 并 没有 提供 太 多 的 相关 示例 ， 这 些 内 容 可 以 在 JRockit 文档 和 
JRockit 诊断 指南 中 找到 。 

































































GS 本 节 中 所 介绍 的 命令 行 参数 均 以 JRockit R28 版 本 为 基准 , 在 其 他 的 版 本 中 ， 
标志 的 含义 可 能 不 尽 相 同 ， 具 体 情 况 请 查阅 相关 文档 。 


1. 内 存 管 理 调 优 
本 节 将 介绍 与 内 存 管理 系统 和 垃圾 回收 器 相关 的 命令 行 参数 。 
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在 第 3 章 中 曾经 介绍 过 , 命令 行 参数 -xms 和 -xmx 分 别 可 以 用 来 设置 堆 的 初始 大 小 的 最 大 
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如 果 应 用 程序 有 实时 性 的 要 求 , 则 根据 当前 系统 所 能 支持 的 资源 大 小 , 将 -Xmx 和 -xms 设置 
为 相同 的 值 ， 以 避免 堆 在 应 用 程序 运行 过 程 中 出 现 伸缩 的 情况 。 

下 面 的 示例 中 ， 将 堆 的 初始 值 和 最 大 值 均 设置 为 1 GB. 

java -Xms1024M -Xmx1024M Application 

@ 设置 垃圾 回收 算法 

针对 应 用 程序 的 特点 选择 合适 的 垃圾 回收 算法 是 很 重要 的 。 如 果 对 应 用 程序 的 响应 时 间 有 要 
求 的 话 ， 那 么 不 要 忘 了 使 用 命令 行 参数 -XpauseTarget 来 设置 相应 的 服务 级 别 。 

如 果 应 用 程序 执行 的 是 批 处 理 作业 , 优化 目标 一 般 是 最 大 化 吞吐 量 , 那么 就 可 以 设置 命令 行 
参数-XgcPrio :throughput. 

下 面 的 示例 将 JVM 的 优化 目标 设置 为 低 延 迟 ， 并 设 定期 望 的 最 大 暂停 时 间 为 250 毫秒 。 

java -XgcPrio:pausetime -XpauseTarget:250ms 


@ 内 存 整 理 

随 着 应 用 程序 的 不 断 运行 , 推 中 的 内 存 呈 现 出 碎片 化 的 趋势 . 早期 的 应 用 程序 对 碎片 化 没 什 
么 办 法 ， 只 能 重启 应 用 程序 ， 但 这 种 方式 会 加 大 应 用 程序 的 整体 延迟 ， 浪 费 CPU 资源 。 从 已 有 
的 经 验 看 ， 对 堆 的 一 部 分 空间 进行 整理 可 以 有 效应 对 碎片 化 的 问题 。JRockit SVM 中 使 用 的 就 是 
这 种 策略 ， 并 在 自 适应 运行 时 的 帮助 下 ， 自 行 调整 垃圾 回收 的 行为 。 

垃圾 回收 的 一 大 瓶颈 就 是 内 存 整 理 , 因为 这 一 步 操作 很 难以 完全 并 发 的 方式 执行 。 如果 能 够 
获得 有 关内 存 碎 片 和 对 象 大 小 相关 的 信息 ( 例如 可 以 通过 TRockit Flight Recorder 套件 得 到 这 些 信 
息 )， 那么 在 做 调 优 的 时 候 就 能 更 具 针 对 性 。 就 JRockit 来 说 ， 可 以 使 用 命令 行 参数 -xxcompaction 
及 其 相关 参数 来 指定 与 内 存 整 理 相 关 的 行为 。 

JRockit 中 内 存 整 理 的 算法 是 将 堆 划 分 成 多 个 同样 大 小 的 分 区 ， 内 存 整 理 以 分 区 为 单位 进行 ， 
以 便 尽 可 能 不 去 暂停 应 用 程序 。 默 认 配置 下 ， 会 使 用 4096 个 分 区 ， 实际 应 用 时 如 果 执 行内 存 整 
理 的 速度 跟 不 上 内 存 碎 片 化 的 速度 , 则 需要 减少 分 区 的 数量 ; 如 果 内 存 整理 使 应 用 程序 暂停 过 多 
的 话 ， 则 可 以 增 大 分 区 的 数量 。 典 型 情况 下， 如果 优 化 策略 不 是 针对 最 大 化 否 吐 量 的 话 ， 垃圾 回 
收 器 所 整理 出 的 内 存 空间 的 大 小 很 大 程度 上 取决 于 执行 内 存 整理 的 频率 。 使 用 命令 行 参 数 
-XXcompaction:heapParts=n 可 以 用 来 设 定 所 使 用 的 分 区 数量 。 

在 Rockit 中 ， 内 存 整理 分 为 内 部 整理 和 外 部 整理 两 类 ， 其 中 外 部 整理 也 被 称 为 清理 。 内 部 
整理 的 操作 只 集中 于 某 个 内 存 分 区 内 部 ， 将 对 象 移动 到 分 区 头 部 ， 而 不 会 将 其 移动 到 其 他 分 区 。 
外 部 整理 会 同时 作用 于 多 个 分 区 , 并 尽量 将 对 象 移动 到 整个 堆 的 头 部 ,从 而 降低 整个 堆 的 碎片 化 
程度 。 因 此 ， 相 比 于 内 部 整理 ， 外 部 整理 的 并 发 性 较 低 ， 而 且 会 有 一 个 较 长 时 间 的 、STW 式 的 

内 存 整 理 是 以 滑动 窗口 的 形式 完成 对 整个 堆 的 整理 。 月 前 JRockit 中 会 交错 使 用 内 部 整理 和 
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外 部 整理 ， 如 果 本 次 垃圾 回收 使 用 的 是 内 部 整理 ， 则 下 一 次 会 使 用 外 部 整理 。 


命令 








行 参数 -XXcompcation: internalPercentage 和 -xXcompcation:externalPercentag 
分 别 用 于 设置 执行 内 存 整理 时 会 对 多 少 个 分 区 执行 整理 操作 。 

如 果 已 知 应 用 程序 的 对 象 分 配 策略 ， 并 且 期 望 降低 系统 延迟 ， 那 么 可 以 使 用 命令 行 参数 
-XXcompaction:enable=false 来 关闭 所 有 的 内 存 整理 操作 。 在 启用 这 个 参数 之 前 , 应 该 先 通 
过 JRockit Mission Control 来 确认 是 否 有 必要 处 理 碎片 化 问题 。 关 闭 内 存 整理 可 以 大 幅 减 少 内 存 
管理 中 对 暂停 Java 应 用 程序 的 需求 ， 但 对 于 那些 内 存 较 大 、 运 行 时 间 较 长 的 应 用 程序 来 说 ， 关 
闭 内 存 整 理 很 有 可 能 最 终 会 使 应 用 程序 因 发 生 outofMemoryError $R m AAR o 

另 一 方面 ， 如 果 应 用 程序 对 延迟 没什么 要 求 ， 而 是 只 关心 春 吐 量 的 话 , 那么 可 以 使 用 命令 行 
参数 -XXcompaction:ful1， 该 标志 会 强制 垃圾 回收 器 在 每 次 执行 垃圾 回收 时 对 整个 堆 做 内 存 
整理 ， 尽 可 能 降低 内 存 中 碎片 化 程度 ,代价 是 有 较 长 的 暂停 时 间 。 在 某 些 案例 中 ， 对 整个 堆 执 行 
内 存 整理 的 速度 很 慢 ， 导 致 应 用 程序 暂停 时 间 过 长 ,结果 使 吞吐 量 下 降 ， 因 此 使 用 时 要 仔细 分 析 
应 用 程序 的 行为 特点 。 























































































































| Æ JRockit Mission Control 中 ， 有 时 也 把 对 整个 堆 做 内 存 整 理 的 操作 称 为 异 

常 整理 (exceptional compaction ) 。 

对 于 那些 追求 低 延 迟 的 应 用 程序 来 说 , 如 果 内 存 整理 的 时 间 过 长 , 则 应 该 终止 当前 的 内 存 整 
理 操作 。 在 默认 的 吞吐 量 优先 垃圾 回收 器 中 ,中断 内 存 整理 默认 是 被 禁用 的 ,可 以 通过 设置 命令 
行 参 数 -XXcompaction:abortable 来 强制 启用 。 

还 有 一 些 其 他 命令 行 参 数 可 用 来 调整 内 存 整理 操作 , 这 些 内 容 超出 本 书 范围 , 相关 内 容 请 查 
阅 IRockit 诊断 指南 。 最 后 强调 一 下 ， 当 为 了 提升 应 用 程序 的 实时 性 而 调整 与 内 存 整理 相关 的 参 
数 时 ， 有 可 能 会 使 应 用 程序 的 整体 性 能 有 较 大 波动 ， 降 低 应 用 程序 暂停 时 间 的 确定 性 。 

以 下 为 几 个 使 用 命令 行 参数 调整 垃圾 回收 行为 的 示例 。 

禁用 内 存 整理 : 

java -XXcompaction:enable=false <application> 

对 整个 堆 执 行内 存 整 理 ， 最 大 化 吞吐 量 : 

java -XXcompaction:full <application> 

将 堆 划 分 为 512 个 分 区 ， 每 次 内 部 整理 会 处 理 1.5 个 分 区 ， 每 次 外 部 整理 会 处 理 2 个 分 区 : 


java -XXcompaction:internalPercentage=1.5, externalPercentage=2,heapParts=512 
<application> 


以 最 大 化 吞吐 量 为 主要 优化 目标 ， 同 时 允许 中 断 内 存 整理 操作 以 兼顾 对 低 延 迟 的 需求 : 


java -XgcPrio:throughput -XXcompaction:abortable=true <application> 
















































































@ 调整 System.gec() 方 法 
命令 行 参数 -xx:AllowSystemGC 可 用 来 设置 是 否 允许 调用 system.gc () 方 法 。 设 置 命令 
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行 参数 -XX:AllowSystemGC=false 会 将 system.gc () 方 法 变 为 空 方法 。 默 认 情 况 下 是 允许 开 
发 人 员 调 用 system.gc () 方 法 的 ， 调 用 该 方法 有 可 能 会 引起 对 整个 堆 的 垃圾 回收 操作 ， 因 此 频 
繁 调用 该 方法 反而 可 能 会 降低 应 用 程序 的 整体 性 能 。 与 system. gc () 方 法 相关 的 问题 及 解决 方 
案 请 参见 第 3 章 和 本 章 中 的 介绍 。 

另 一 方面 ， 对 于 追求 高 吞 叶 量 的 应 用 程序 来 说 ， 使 用 命令 行 参 数 -XX:FullsystemGc 可 以 
强制 JVM 在 调用 System. gc () 方 法 时 对 整个 堆 执行 垃圾 回收 操作 。 使 用 该 参数 时 要 谨慎。 

下 面 的 示例 中 ， 强 制 JVM 在 调用 system.gc() 方 法 时 对 整个 堆 执行 垃圾 回收 操作 。 


java -XX:FullSystemGC=true <application> 


o 调整 新 生 代 大 小 

在 第 3 章 中 曾经 介绍 过 , 新 生 代 用 来 存储 短 生命 周期 的 对 象 JVM 会 根据 运行 时 反馈 信息 动 
态 调整 新 生 代 的 大 小 。 如 果 JVM 使 用 分 代 式 垃圾 回收 ， 并 且 应 用 程序 在 运行 过 程 中 会 产生 大 量 
的 临时 对 象 , 则 可 以 通过 命令 行 参数 -xns 来 设置 一 个 较 大 的 新 生 代 。 当 以 吞吐 量 为 优化 目标 时 ， 
可 以 跳 过 分 代 式 垃圾 回收 的 配置 ， 直 接 使 用 命令 行 参数 -xgcPrio:throughput。 

下 面 的 示例 展示 了 如 何 将 新 生 代 的 大 小 设置 为 10 MB。 

java -Xns:10M <application> 

@ 选择 垃圾 回收 策略 

如 果 自 适应 垃圾 回收 策略 由 于 某 些 原因 而 变换 得 过 于 频繁 ， 则 可 以 通过 命令 行 参数 
-XXdisableGCHeuristics 来 禁用 自 适 应 运行 时 对 垃圾 回收 策略 的 切换 ， 此 时 ， 内 存 整理 和 新 
生 代 的 大 小 并 不 受 影响 。 
























































| 注意 ， 这 个 参数 只 在 JRockit R28 之 前 的 版 本 中 有 效 。 就 R28 版 本 来 说 ， 垃 
> 圾 回收 策略 的 切换 操作 本 来 就 已 经 禁用 了 ， 因 此 这 个 参数 也 就 被 废弃 了 。 

© 调整 TLA 以 适应 大 对 象 

在 第 3 章 中 曾经 介绍 过 ， 当 TLA 已 满 时 ， 会 将 其 中 的 对 象 提升 到 推 中。 使 用 命令 行 参数 
-XXtlaSize 可 以 显 式 设置 TLA 区 域 的 大 小 。 当 待 分 配对 象 的 大 小 超过 了 TLA 剩余 容量 时 , 或 
者 在 TLA 中 分 配 内 存 会 导致 过 多 的 空间 被 浪费 掉 时 ，JVM 可 能 会 直接 在 堆 中 为 对 象 分 配 内 存 。 
这 种 实现 机 制 可 以 避免 TLA 被 过 快 填 满 ， 进 而 避免 了 频繁 提升 对 象 到 堆 中 的 性 能 损耗 。 

对 于 应 用 程序 来 说 ， 对 大 对 象 的 处 理 确实 是 个 问题 。 如 果 已 知 应 用 程序 中 常用 对 象 的 大 小 ， 
则 对 TLA 进行 相关 设置 可 以 提升 执行 性 能 。 

下 面 的 示例 将 TLA 的 理想 空间 设置 为 8 KB， 最 小 可 接受 空间 为 2 KB. 


java -XXtlaSize:min=2k,preferred=8k <application> 
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在 JRockit R28 之 前 的 版 本 中 ， 并 没有 启用 TLA， 大 对 象 是 直接 分 配 在 堆 中 
的 。 命令 行 参 数 -XxlargeObjectLimit 用 来 指定 所 谓 “ 大 对 象 ” 所 占 空间 的 最 
小 值 ， 默 认 值 是 2KB。 从 R28 版 本 起 ，JRockit 使 用 了 更 为 灵活 的 浪费 限额 来 替 
代 参 数 XXlargeObjectLimit, 限制 指定 了 在 TLA 中 分 配 大 对 象 时 ， 可 以 被 浪 
Va 费 掉 空间 的 最 大 值 。 
> 因此 ,从 R28 版 本 起 , ÆTLA FARAH, 如果 TLA 的 空闲 空间 中 放 不 
FUR, 而 且 浪 费 限 额 的 值 小 于 TLA 中 剩余 空闲 空间 的 大 小 ， 则 直接 在 堆 中 为 
对 象 分 配 内 存 ; 否则 ，JRockit 会 根 绝 目标 对 象 的 大 小 来 决定 是 “浪费 ” 掉 这 个 
TLA 区 域 ， 尝 试 将 在 一 个 新 的 TLA 中 为 对 象 分 配 内 存 ， 还 是 直接 在 堆 中 为 对 象 
分 配 内 存 。 





下 面 是 与 调整 TLA 相关 的 一 些 示例 。 

将 大 对 象 的 大 小 限制 提高 到 16 KB ， 该 参数 只 在 JRockit R28 之 前 的 版 本 中 有 效 。 
java -XXlargeObjectLimit:16k <application> 

设置 TLA 的 大 小 为 256 KB， 最 小 可 收缩 到 16 KB， 可 接受 的 最 大 浪费 空间 是 8 KB。 
java -XXtlaSize:min=16k,preferred=256k,wasteLimit=8k <application> 


更 多 与 大 对 象 相关 的 优化 细节 请 参见 本 章 后 续 小 节 中 的 内 容 。 频繁 地 将 还 有 不 少 空闲 空间 的 
TLA 中 的 对 象 提升 到 堆 中 是 很 浪费 的 ， 而 且 会 抵消 掉 使 用 TLA 所 带 来 的 好 处 ， 因 此 开发 人 员 需 
要 在 堆 碎片 化 和 频繁 创建 TLA 所 带 来 的 性 能 损耗 之 间 做 权衡 。 

@ 调整 垃圾 回收 线程 的 数量 

JRockit 倾向 于 假设 自己 会 独占 计算 机 资源 ， 因 此 会 使 用 尽 可 能 多 的 线程 来 执行 垃圾 回收 ， 
直到 达到 操作 系统 和 物理 硬件 的 限制 。 典 型 情况 下 ，JRockit 使 用 的 垃圾 回收 线程 数 与 物理 机 器 
的 CPU 核 数 相同 。 如 果 出 于 某 些 原因 而 不 便于 这 样 做 ,例如 还 有 其 他 应 用 程序 也 需要 大 量 使 用 
CPU， 则 可 以 通过 命令 行 参数 -xxgcThreads 来 显 式 指定 垃圾 回收 的 线程 数 。 

如 果 垃 圾 回收 线程 数 太 少 , 则 可 能 会 导致 垃圾 回收 的 速度 跟 不 上 垃圾 对 象 的 生产 速度 , 在 极 
端 情况 下 ， 会 导致 VM 抛 出 OutofMemoryError 错误 ， 不 过 更 有 可 能 导致 JVM 频繁 对 整个 堆 
执行 垃圾 回收 ， 而 这 将 大 大 增加 应 用 程序 的 延迟 。 

下 面 的 示例 设置 垃圾 回收 的 线程 数 为 4。 


java -XXgcThreads:4 <application> 


e NUMA 架构 与 CPU # Fett 

大 部 分 现代 操作 系统 都 可 以 为 进程 设置 CPU 亲 和 性 ， 使 进程 始终 运行 在 某 个 或 某 几 个 CPU 
Eo Æ NUMA 架构 下 ，CPU 亲 和 人 性 更 重要 ， 可 以 通过 将 SVM 进程 绑 定 在 某 几 个 NUMA 节点 上 
来 提高 局 部 性 ， 当 然 ， 这 样 会 使 动态 性 和 内 存 访问 效率 有 所 降低 。 因 此 ， 在 调整 CPU 亲 和 性 之 
前 , 一 定 要 清楚 掌握 应 用 程序 的 行为 。 

命令 行 参 数 -xx:BindToCPUs 可 强制 TRockit 只 使 用 某 几 个 固定 的 CPU 核心 。 
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下 面 的 示例 中 ，JRockit 只 使 用 编号 为 0 和 2 的 CPU 核心 。 

java -XX:BindToCPUs=0,2 <application> 

就 NUMA 架构 来 说 ,还 可 以 使 用 命令 行 参数 -xx:BindToNumaNodes 来 控制 内 存 分 配 策略 。 
该 参数 用 于 指定 JRockit 是 在 所 有 的 NUMA 节点 中 平均 分 配 内 存 页 , 还 是 只 在 本 地 节点 中 分 配 内 
存 ， 参 数值 preferredlocal 表示 JRockit 会 尽 可 能 使 用 本 地 节点 ， 参 数值 interleave 表示 
JRockit 会 在 所 有 的 NUMA 节点 中 平均 分 配 内 存 。 

下 面 的 示例 中 ， 将 强制 在 分 配 内 存 时 使 用 本 地 节点 。 其 他 可 选 值 是 preferredlocal 或 


interleave. 











java -XX:NumaMemoryPolicy=strictlocal <application> 

2. 代码 生成 调 优 

本 节 将 介绍 与 代码 生成 相关 的 命令 行 参数 。 

© 调用 分 析 

使 用 命令 行 参数 -Xx:UsecallProfiling， 可 以 让 JRockit 代码 生成 器 在 做 JIT 编译 时 ， 添 
加 相应 的 分 析 代码 来 收集 代码 运行 时 的 相关 数据 ， 以 便 更 准确 地 制定 代码 优化 策略 。 

当然 ,为 了 不 影响 目标 方法 的 执行 性 能 ， 不 能 在 做 JIT 编译 时 随意 添加 分 析 代 码 。 但 如 果 应 
用 程序 将 会 运行 很 长 一 段 时 间 的 话 ， 那 么 热 方 法 基本 上 都 会 被 JIT 优化 编译 器 处 理 过 ， 之 前 遗留 
的 分 析 代 码 也 会 被 优化 去 掉 ，, 如 果 优 化 编译 器 收集 到 了 足够 的 调用 信息 , 那么 经 过 优化 的 方法 会 
比 之 前 运行 得 更 快 。 

默认 情况 下 ， 调 用 分 析 是 被 禁用 的 ,不 过 在 将 来 可 能 会 改 为 默认 启用 。 该 参数 尤其 适用 于 那 
些 具 有 很 长 调用 链 的 应 用 程序 。 

在 下 面 的 示例 中 ,会 启用 调用 分 析 来 收集 热 方 法 的 调用 信息 。 

java -XX:UseCallProfiling=true <application> 

© 调整 优化 编译 器 的 线程 数 

JRockit 中 的 代码 优化 算是 相当 激进 的 操作 ， 需 要 耗费 大 量 的 CPU 时 间 和 内 存 资源 ， 但 如 果 
消耗 的 太 多 的 CPU 资源 就 不 值得 了 。 在 第 2 章 中 曾经 介绍 过 ， 可 以 通过 相关 的 命令 行 参数 来 控 
制 JIT 编译 器 工作 时 所 使 用 的 线程 数 。 

如 果 CPU 的 工作 负载 不 高 ， 而 且 物 理 机 器 上 存在 大 量 的 CPU 核心 ,那么 增加 执行 优化 编译 
工作 的 线程 数 可 以 使 应 用 程序 更 快 达到 稳定 运行 的 状态 。 

JRockit 中 ， 命 令 行 参数 -XX:OoptThreads 和 -Xx:JITThreads 分 别 用 来 设置 优化 编译 器 和 
JIT 编译 需 的 工作 线程 的 数量 。 

这 两 个 参数 的 默认 值 都 是 1, 如 果 想 使 用 更 多 线程 的 话 , 需要 做 基准 测试 确认 这 样 更 有 效率 。 
事实 上 ， 即 使 是 只 使 用 1 个 线程 ,应 用 程序 最 终 也 能 达到 稳定 运行 的 状态 ， 只 不 过 所 需 的 时 间 更 
长 一 些 。 

下 面 的 示例 分 别 展 示 了 如 何 调整 JIT 编译 器 和 优化 编译 器 中 线程 的 数量 。 
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java -XX:JITThreads=2 <application> 
java -XX:OptThreads=2 <application> 


o 关闭 代码 优化 

代码 优化 是 计算 密集 型 操作 ， 需 要 耗费 很 多 CPU 资源 ， 因 此 可 能 会 产生 过 大 的 执行 消耗 ， 
例如 可 能 会 使 热身 周期 过 长 ， 或 者 使 延迟 增 大 。 在 这 种 情况 下 ， 可 以 通过 命令 行 参数 -Xnoopt 
来 全 面 禁用 代码 优化 。 禁 用 代码 优化 之 后 ，JVM 的 行为 将 更 具 可 预测 性 ， 但 执行 性 能 将 受到 影 
响 ， 针 对 于 此 ， 可 以 使 用 命令 行 参数 -Xxx:DisableoptsAfter 来 指 定 在 多 少 秒 之 后 禁用 代码 优 
化 操作 。 

下 面 的 示例 展示 了 如 何 禁 用 代码 优化 。 

彻底 禁用 代码 优化 : 

java -XnoOpt <application> 

十 分 钟 之 后 禁用 代码 优化 : 

java -XX:DisableOptsAfter=600 

3. 锁 与 线程 调 优 

通常 情况 下 不 需要 对 锁 调 优 , 其 默认 行为 就 挺 不 错 的 , 用 户 自行 修改 锁 的 行为 通常 不 会 带 来 
什么 性 能 提升 , 好 好 调 优 应 用 程序 才 是 正 途 。 不 过 为 了 保证 内 容 的 完整 性 ， 本 节 还 是 会 简单 介绍 
JRockit 中 与 控制 锁 行为 相关 的 命令 行 参数 。 

o 延迟 解锁 

在 第 4 章 曾 经 介绍 过 ， 当 某 个 锁 对 象 频繁 地 被 同一 个 线程 加 锁 (释放 ) 时 ， 启 用 延迟 解锁 
是 可 以 提升 整体 性 能 的 。 如 果 某 个 线程 很 快 会 重新 获取 锁 ， 那 么 实在 没 必要 在 这 么 短 的 时 间 内 
释放 锁 。 

在 JRockit P, 延迟 解锁 是 默认 启用 的 ( 除非 是 在 Java 1.6 版 本 之 前 , 使 用 准确 式 垃 圾 回收 )， 
当然 ,用户 也 可 以 通过 命令 行 参 数 -XX:UseLazyUnlocking 来 显 式 指定 是 否 启用 延迟 解锁 。 

下 面 示例 展示 了 如 何 显 式 禁 用 延迟 解锁 。 

java -XX:UseLazyUnlocking=false <application> 

此 外 ， 当 自 适 应 运行 时 发 现 ， 对 于 某 个 类 的 对 象 来 说 ,延迟 解锁 的 前 提 假 设 总 是 不 成 立 ， 则 
会 对 该 类 的 所 有 对 象 禁止 延迟 解锁 。 用 户 可 通过 命令 行 参数 -xx:UseLazyUnlockingClassBan 
来 显 式 设 置 。 

° 设置 线程 的 优先 级 

java.1lang.Thread 类 支持 对 线程 优先 级 的 设置 , 但 通常 虚拟 机 不 会 提供 具体 的 实现 ， 因 而 
不 会 有 实际 作用 。 这 么 做 是 因为 在 Java 层面 设置 线程 优先 级 会 扰乱 操作 系统 的 线程 调度 策略 ， 可 
能 会 引发 意 想不到 的 问题 ， 得 不 偿 失 。 

默认 情况 下 ,JRockit 会 忽略 对 java.lang.Thread#setPriority (int) 方法 的 调用 , 用 户 
可 以 通过 命令 行 参数 -xx:UseThreadPriorities 来 强制 其 支持 对 线程 优先 级 的 修改 操作 。 如 
下 面 的 示例 所 示 。 
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java -XX:UseThreadPriorities=true <application> 

o FAS ARS BO Se i BE 

Pa MAG RESEN, Da Ak UC AY LC BIAS MI TT OE, BL ), 
可 以 提升 应 用 程序 的 整体 性 能 。 

下 面 的 示例 指定 了 在 将 瘦 锁 提升 为 胖 锁 之 前 需要 在 瘦 锁 中 上 自 旋 100 次 : 

java -XX:ThinLockConvertToFatThreshold=100 <application> 

在 JRockit 中 ,， 自 旋 操 作 并 不 是 单纯 浪费 CPU 资源 ， 因 为 在 每 次 迭代 中 都 会 有 短 时 间 的 暂停 
或 主动 让 出 当前 CPU 的 使 用 权 ， 所 以 ,在 不 同 的 CPU 平 台 上 ， 指 定 相 同 的 循环 迭代 次 数 完全 可 
能 会 导致 不 同 的 总 体循环 时 间 。 

示例 ， 禁 用 锁 收缩 操作 ， 默 认为 true: 

java -XX:UseFatLockDeflation=false <application> 

示例 ， 在 遇 到 10 次 非 竞 争 的 锁 获 取 操作 之 后 ， 执 行 锁 收缩 操作 : 

java -XX:FatLockDeflationThreshold=10 <application> 

在 第 4 章 中 曾经 提 到 过 ，JRockit 中 的 胖 锁 实现 中 使 用 了 自 旋 周期 很 短 的 自 旋 锁 ， 以 便 在 真 
正 进 入 胖 锁 之 前 还 能 有 一 次 机 会 通过 瘦 锁 完成 操作 。 这 部 分 行为 可 以 通过 命令 行 参数 来 修改 。 

示例 ， 在 胖 锁 中 禁用 自 旋 锁 : 

java -XX:UseFatSpin=false <application> 

示例 ， 禁 用 胖 锁 中 自 旋 锁 的 自 适 应 调整 : 

java -XX:UseAdaptiveFatSpin=false <application> 

除了 上 面 提 到 的 命令 行 参数 外 , 还 有 一 些 其 他 的 参数 可 用 于 控制 锁 的 行为 , 更 多 详细 内 容 请 
查阅 JRockit 诊断 指南 。 总 之 ， 在 通过 命令 行 参数 调整 锁 的 行为 时 ， 为 避免 出 现 意外 情况 ， 一 定 
要 谨慎 。 

4. 通用 调 优 

本 节 简 单 介绍 其 他 一 些 没有 归 类 的 与 调 优 相关 的 命令 行 参 数 。 

o 压缩 指针 

在 第 3 章 中 曾经 介绍 过 ， 在 64 位 平台 上 ， 大 部 分 情况 下 是 默认 启用 指针 压缩 的 ， 不 需要 显 
式 配 置 。 默 认 情 况 下 ，JRockit 会 根据 当前 JVM 进程 中 堆 的 最 大 值 来 选择 对 应 的 指针 压缩 方式 ， 
不 过 用 户 也 可 以 显 式 指定 具体 的 压缩 方式 ， 使 用 相关 参数 之 前 请 查阅 文档 。 

示例 ， 禁 用 指针 压缩 : 

java -XXcompressedRefs:enable=false <application> 

示例 ， 启 用 引用 压缩 ， 所 支持 的 堆 最 大 为 64GB : 

java -XXcompressedRefs:enable=true,size=64GB <application> 


e 大 内 存 页 支持 
大 内 存 页 可 应 用 于 代码 缓冲 区 和 堆 ， 通 过 命令 行 参数 -XX:UseLargePagesForHeap 和 
































































































































138 ”第 5 章 基准 测试 与 性 能 调 优 


























-XX:UseLargePagesForCode 来 显 式 指定 是 否 启 用 ， 默认 情况 下 ， 是 完全 不 启用 大 内 存 页 的 。 
如 果 当 前 操作 系统 支持 大 内 存 页 ， 而 且 能 够 合理 配置 的 话 ， 则 启用 大 内 存 页 可 以 大 幅 提升 旁 路 
转换 缓冲 的 命中 率 。 对 于 内 存 密 集 型 应 用 程序 来 说 , 使 用 大 内 存 页 可 以 使 整体 性 能 提升 10% ~ 15%。 
对 于 需要 长 时 间 运 行 的 大 型 应 用 程序 来 说 , 推荐 试用 大 内 存 页 ， 如果 操作 系统 不 支持 大 内 存 
页 的 话 ，JRockit 会 打印 警告 信息 ， 并 回归 到 普通 模式 运行 。 
示例 ， 在 代码 缓冲 区 中 启用 大 内 存 页 : 
java -XX:UseLargePagesForCode=true <application> 
示例 ， 在 堆 中 启用 大 内 存 页 : 


java -XX:UseLargePagesForHeap=true <application> 



































5.7 ”常见 性 能 瓶颈 与 规避 方法 


在 之 前 几 章 中 都 有 与 常见 陷阱 和 伪 优化 相关 的 内 容 , 在 做 基准 测试 时 ， 要 规避 这 些 问 题 ， 就 
需要 对 性 能 瓶 贷 和 代码 中 常 出 现 的 反 模式 有 深入 的 理解 。 


需要 注意 的 是 ， 在 做 字 节 码 注 入 时 ， 一定 要 注意 对 侵入 程度 的 控制 。 例 如 ， 
如 果 字 节 码 注入 工具 在 应 用 程序 各 处 代码 中 都 插入 了 额外 的 字 节 码 操 作 , 则 很 有 
可 能 会 完全 改变 应 用 程序 的 执行 时 间 , 从 而 导致 无 法 根据 执行 结果 对 原 系 统 做 出 
as 准确 的 分 析 。 尽 管 有 不 少 简便 的 字 节 码 注 入 工具 可 以 通过 代码 注入 来 实现 一 些 特 
殊 功 能 , 例如 事件 计数 器 等 , 但 实际 这 些 工具 很 少 能 够 做 出 真正 准确 的 分 析 ， 而 
且 使 用 字 节 码 注 入 工具 时 ， 应 用 程序 不 得 不 重新 编译 运行 。 相 比 之 下 ，JRockit 
Mission Control 套件 则 可 以 通过 插件 的 形式 在 应 用 程序 运行 过 程 中 完成 作业 ， 而 

且 不 会 产生 额外 的 执行 消耗 。 





一 般 来 说 ,基准 测试 或 代码 注入 分 析 可 以 帮助 找 出 应 用 程序 的 性 能 瓶 贷 。 这 些 年 来 , 我 们 已 
经 处 理 过 很 多 性 能 问题 ， 其 中 一 些 往往 会 重复 出 现 ， 下 面 将 介绍 这 些 常 见 的 问题 以 及 规避 方法 。 


5.7.1 命令 行 参 数 -XXaggressive 


在 以 往 的 工作 中 ， 不 止 一 次 看 到 用 户 在 使 用 JRockit 时 会 加 上 了 试验 性 质 的 命令 行 参数 
-XXaggressive。 该 命令 行 参数 是 其 他 命令 行 参数 的 包装 器 ， 用 来 通知 JRockit 快速 热身 ， 尽 可 
能 快 地 达到 稳定 运行 状态 ， 使 用 该 参数 后 ，JRockit 会 在 启动 时 消耗 更 多 的 资源 。 由 于 该 参数 是 
试验 性 质 ， 并 且 未 记录 于 文档 中 ， 故 而 在 不 同 的 Rockit 发 行 版 中 ， 该 参数 所 涉及 的 优化 选项 不 
尽 相同 , 我 建议 不 要 轻易 使 用 该 参数 。 不 过 在 对 应 用 程序 的 性 能 做 对 比分 析 时 ， 可 以 将 该 参数 作 
为 其 中 一 种 配置 加 以 分 析 。 最 后 强调 一 下 ， 使 用 该 参数 时 ， 一 定 要 谨慎 。 
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5.7.2” 析 构 函 数 


正如 在 第 3 章 中 介绍 的 ， 就 Java 来 说 ， 析 构 函 数 finalize 是 不 安全 的 ， 它 可 以 复活 对 象 ， 
从 而 妨碍 垃圾 回收 的 执行 。 此 外 ，JVM 在 执行 这 些 析 构 函数 时 也 会 产生 一 些 开销 。 
垃圾 回收 器 会 分 别 跟踪 每 个 将 要 被 释放 掉 的 对 象 ， 当 调用 finalize 方法 时 会 产生 执行 开 
销 ， 如 果 存 在 逻辑 非常 复杂 的 finalize 方法 ， 开 销 更 大 。 因 此 ， 最 好 不 要 使 用 这 个 方法 。 


5.7.3 引用 对 象 过 多 


在 释放 对 和 象 时 ,垃圾 回收 器 会 对 软 引 用 、 弱 引用 和 虚 引 用 对 象 特殊 处 理 ， 尽管 这 些 引 用 对 象 
都 有 专门 的 用 途 ( 例如 实现 缓存 等 )， 但 如 果 应 用 程序 中 使 用 了 太 多 的 引用 对 象 ， 仍 旧 会 拖 慢 垃 
圾 回收 器 的 运行 。 记 录 它 们 相关 信息 的 操作 开销 会 比 善 通 对 象 ( 强 引 用 对 象 ) 高 一 个 数量 级 。 

使 用 命令 行 参数 -Xxverbose:refobj 可 以 让 JRockit 打 印 出 垃圾 回收 器 对 引用 对 象 的 处 理 信 
息 。 示 例如 下 。 


hastur:material marcus$ java -Xverbose:refobj GarbageCollectionTest 













































































[INFO ][refobj ] [YC#1] SoftRef: Reach: 25 Act: 0 PrevAct: 0 Null: 0 
[INFO ][refobj ] [YC#1] WeakRef: Reach: 103 Act: 0 PrevAct: 0 Null: 0 
[INFO ][refobj ] [YC#1] Phantom: Reach: 0 Act: 0 PrevAct: 0 Null: 0 
[INFO ][refobj ] [YC#1] ClearPh: Reach: 0 Act: O PrevAct: 0 Null: 0 
[INFO ][refobj ] [YC#1] Finaliz: Reach: 12 Act: 3 PrevAct: 0 Null: 0 
[INFO ][refobj ] [YC#1] WeakHnd: Reach: 217 Act: 0 PrevAct: 0 Null: 0 


[INFO ] [refobj 


一 


[YC#1] SoftRef: @Mark: 25 


@Preclean: 0 @FinalMark: 0 

[INFO ] [refobj ] [YC#1] WeakRef: @Mark: 94 
@Preclean: 0 @FinalMark: 9 

[INFO ][refobj ] [YC#1] Phantom: @Mark: 0 
@Preclean: 0 @FinalMark: 0 

[INFO ][refobj ] [YC#1] ClearPh: @Mark: 0 
@Preclean: 0 @FinalMark: 0 


[INFO ][refobj ] [YC#1] Finaliz: @Mark: 0 
@Preclean: 0 @FinalMark: 15 
[INFO ][refobj ] [YC#1] WeakHnd: @Mark: 0 
@Preclean: 0 @FinalMark: 217 
[INFO ] [refobj ] [YC#1] SoftRef: SoftAliveOnly: 24 SoftAliveAndReach:1 
[INFO ] [refobj ] [YC#1] NOTE: This count only 
applies to a part of the heap. 


从 上 面 的 示例 中 可 以 看 出 ， 应 用 程序 中 的 引用 对 象 并 不 多 ， 垃 圾 回收 需 处 理 起 来 并 不 费劲 。 
不 过 ， 当 应 用 程序 中 存在 大 量 引 用 对 象 时 ， 要 小 心 处 理 。 


5.7.4 wR 


正如 在 第 3 章 中 介绍 的 , 通常 情况 下 , 为 了 降低 内 存 分 配 的 开销 而 通过 对 象 池 来 重复 使 用 对 
象 ， 并 不 能 获得 良好 的 效果 。 
对 象 池 除了 会 影响 垃圾 回收 器 的 工作 负载 和 策略 调整 之 外 , 还 会 延长 对 象 的 生命 周期 , 最 终 
使 这 些 对 象 被 提升 至 老年 代 。 这 会 带 来 额外 的 执行 开销 , 并 加 速 堆 的 碎片 化 。 大 量 存活 对 象 是 影 
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响 垃 圾 回收 器 执行 性 能 的 一 大 因素 , 垃圾 回收 器 被 优化 为 主要 处 理 短 生 命 周期 对 象 ， 而 对 象 池 恰 
恰 “ 贡 献 ” 了 不 少 长 生命 周期 的 存活 对 象 ， 不 利于 垃圾 回收 工作 的 执行 。 

除 此 之 外 ， 从 局 部 性 原理 来 说 ， 使 用 新 对 象 而 不 是 池 化 对 象 能 够 更 有 效 地 利用 缓存 。 

但 凡事 无 绝对 ,在 某 些 特殊 的 应 用 程序 中 ,内存 分 配 , 尤其 是 内 存 清 零 的 操作 ， 可 能 会 成 为 
应 用 程序 的 性 能 瓶颈 。 由 于 Java 要 求 每 个 新 对 象 都 以 默认 值 初始 化 ， 内 存 清 零 的 操作 必 不 可 少 。 
当 应 用 程序 中 需要 很 多 大 对 象 时 ( 例如 大 数组 对 象 ), 使 用 对 象 池 可 能 会 提升 整体 性 能 。 就 JRockit 
来 说 ， 如 果 优化 编译 需 能 够 证 明 内 存 清 零 不 是 必要 操作 的 话 ， 就 会 在 执行 优化 编译 时 ,剔除 内 存 
清 零 的 操作 。 

记 住 ,“ 简 单 即 是 美 ”。 


5.7.5 ”算法 与 数据 结构 


从 算法 与 数据 结构 上 讲 , 哈 希 表 会 比 链表 更 适用 于 快速 查找 。 通 常情 况 下 ,快速 排序 的 时 间 
复杂 度 是 O(nlogn)， 优 于 冒 泡 排 序 的 O(n )。 在 讲解 下 面 的 内 容 时 ， 我 们 假设 读者 已 经 具备 了 为 
最 小 化 算法 复杂 度 而 挑选 合适 的 算法 和 数据 结构 的 能 力 。 

1. 典型 问题 

如 果 某 个 第 三 方 应 用 程序 写 得 很 烂 , 很 有 可 能 存在 滥用 数据 结构 的 问题 , 通过 基准 测试 和 审 
查 代码 ， 可 以 发 现 并 解决 性 能 瓶颈 。 

public List<Node> breadthFirstSearchSlow(Node root) { 


List<Node> order = new LinkedList<Node>(); 
List<Node> queue = new LinkedList<Node>(); 





































































































queue.add (root); 


while (!queue.isEmpty()) { 
Node node = queue.remove(0); 
order .add (node) ; 
for (Node succ : node.getSuccessors()) { 
if (!order.contains(succ) && !queue.contains(succ)) { 
queue.add(succ) ; 
} 
} 
} 


return order; 


} 

上 面 的 代码 是 图 的 广度 优先 遍历 实现 。 给 定 某 个 根 节 点 后 ， 算 法 使 用 队列 来 存储 其 子 节 点 ， 
为 了 避免 重复 遍历 节点 , 或 陷入 无 限 循环 , 在 将 某 个 节点 添加 到 队列 之 前 会 检查 该 节点 是 否 已 经 
被 访问 过 。 

在 JDK F, LinkedList 实例 的 contain 方法 通过 线性 查找 的 方式 来 检查 是 否 包含 目标 元 
素 ， 因 此 在 最 坏 情况 下 ， 搜 索 算 法 的 时 间 复 杂 度 会 是 O) (O 为 待 搜索 节点 数量 )， 当 数据 量 很 
大 时 ， 运 行 效率 较 低 。 
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public List<Node> breadthFirstSearchFast (Node root) { 











List<Node> order = new LinkedList<Node>(); 
List<Node> queue = new LinkedList<Node>(); 
Set<Node> visited = new HashSet<Node>(); 


queue.add(root); 
visited.add(root) ; 


while (!queue.isEmpty()) { 
Node node = queue.remove (0); 
order .add (node) ; 


for (Node succ : node.getSuccessors()) { 
if (!visited.contains(succ)) { 
queue.add(succ); 
visited.add(succ) ; 
} 
} 
} 





return order; 


} 
上 面 的 代码 使 用 了 Hashset 来 记录 已 经 访问 过 哪些 节点 ， 避 免 了 对 节点 的 线性 搜索 。 当 数 
据 量 很 大 时 ， 性 能 提升 明显 。 
2. 不 利 的 固有 特性 
滥用 数据 结构 还 会 导致 一 些 其 他 问题 。 例 如 ,链表 作为 一 种 通用 数据 结构 ,可 以 很 方便 地 实 
现 队列 的 入 队 和 出 队 操 作 ， 具 有 常数 时 间 复 杂 度 ， 无 须 其 他 功能 的 支持 。 但 事情 并 不 这 么 简单 ， 
首先 ， 即 使 应 用 程序 中 不 会 遍历 整个 队列 ， 垃 圾 回收 器 在 工作 时 ， 也 必须 要 所 历 。 
如 果 队 列 中 包含 了 大 量 元 素 ， 而 队列 的 生命 周期 较 长 ， 则 会 使 大 量 对 象 保 持 存 活 状 态 。 因 为 
链表 是 通过 对 象 引用 来 连接 对 象 和 数据 载荷 的 , 所 以 链表 中 的 元 素 可 能 存在 于 堆 的 任意 位 置 。 元 素 
在 内 存 中 并 非 紧 挨 在 一 起 , 会 降低 缓存 的 局 部 性 。 因 为 队列 元 素 分 布 在 整个 堆 中 , 而 且 缓存 的 局 部 
性 较 差 ， 所 以 垃圾 回收 器 在 执行 标记 操作 时 ， 缓 存 命中 率 很 低 ， 导 致 应 用 程序 的 暂停 时 间 变 长 。 
因此 ， 看 似 无 害 又 操作 简单 的 数据 结构 会 给 自动 内 存 管 理 系统 带 来 麻烦 。 






















































































5.7.6 误 用 System.gc() 

Java 语言 规范 中 并 未 对 system.gc() 方 法 的 行为 做 任何 保证 ， 假 使 语言 规范 中 真 的 对 
System.gc() 的 功能 做 了 定义 ， 那么 该 方法 的 具体 行为 可 能 并 不 只 是 执行 一 次 垃圾 回收 这 么 简 
单 ， 每 次 调用 该 方法 可 能 会 产生 不 同 的 行为 。 最 后 重申 ， 不 要 期 望 使 用 System.gc() 方 法 来 影 
啊 垃 圾 回收 的 行为 ， 为 安全 起 见 ， 压 根 别 用 system.gc() 方 法 。 


5.7.7 ”线程 数 太 多 


将 大 问题 分 解 为 多 个 独立 的 小 问题 ， 再 交 给 多 个 线程 并 行 计算 ， 看 起 来 这 是 个 不 错 的 主意 ， 
但 实际 上 ,线程 间 的 上 下 文 切 换 也 会 产生 执行 开销 。 第 4 章 已 经 介绍 了 线程 的 几 种 实现 ,无 论 是 





















































142 第 5 章 基准 测试 与 性 能 调 优 





绿色 线程 还 是 操作 系统 线程 ,在 执行 线程 上 下 文 切换 时 ， 都 无 法 执行 应 用 程序 的 业务 逻辑 。 线 程 
间 上 下 文 切换 操作 的 次 数 正比 于 参与 调度 的 线程 数 , 因此 随 着 线程 数 增加 ， 上 下 文 切换 操作 的 执 
行 开销 也 会 随 之 变 大 。 























这 里 不 得 不 说 一 下 IntelIA-64 处 理 器 , 它 有 大 量 的 寄存 器 ,线程 上 下 文 内 容 
的 大 小 会 达到 千 字 节 级 , 每 次 上 下 文 切换 都 需要 复制 大 量 内存 数 据 , 因此 在 Intel 
IA-64 平台 上 ， 多 线程 并 行 执行 的 开销 会 很 大 。 


5.7.8 锁 竞 争 导致 性 能 瓶颈 


有 竞争 的 锁 往 往 是 性 能 瓶颈 之 一 , 因为 竞争 意味 着 多 个 线程 都 需要 访问 同一 个 资源 或 者 执行 
同一 段 代码 。 应 用 程序 中 所 有 的 竞争 都 集中 于 一 个 锁 并 不 少见 , 例如 使 用 某 个 第 三 方 库 执行 日 志 
记录 操作 时 , 每 次 写 日 志 操作 都 需要 获取 全 局 锁 才 能 完成 。 当 多 个 线程 同时 执行 写 日 志 的 操作 时 ， 
该 全 局 锁 就 成 为 了 应 用 程序 的 性 能 瓶颈 。 


5.7.9 不 必要 的 异常 


处 理 异 常 需要 花 时 间 ， 而 且 会 打 断 正常 的 程序 流转 。 通 常情 况 下 ， 最 好 不 要 使 用 异常 来 表示 
执行 结果 或 控制 程序 流转 。 

使 用 异常 分 析 工 具 找 出 异常 的 抛 出 位 置 和 处 理 位 置 是 很 有 用 处 的 , 应 尽 可 能 移 除 所 有 不 必要 
的 硬件 异常 处 理 , 例如 空 指针 异常 和 除 零 异 常 。 由 于 硬件 异常 一 般 由 操作 系统 级 的 硬件 中 断 引起 ， 
处 理 起 来 开销 很 大 , 相 比 之 下 , 虽然 普通 的 Java 异常 也 有 一 些 开销 , 但 由 于 会 在 JVM 内 部 处 理 ， 
所 以 执行 开销 比 硬件 异常 小 得 多 。 
















































































从 以 往 的 工作 经 验 来 看 ， 有些 应 用 程序 会 使 用 NullPointerExceptions 
异常 作为 控制 程序 的 正常 流转 ， 而 实际 上 是 不 必要 的 ， 在 别 除 这 些 代码 后 ， 应 用 
程序 的 性 能 大 幅 提 逢 。 








在 JRockit 中 ， 要 想 找 出 这 些 不 必要 的 异常 很 简单 ， 只 需 在 启动 应 用 程序 时 加 上 命令 行 参数 
-Xverbose:exceptions, 示例 如 下 : 


hastur:~ marcus$ java -Xverbose:exceptions Jvm98Wrapper _200_ check 

[INFO ] [excepti] [00004] java/io/FileNotFoundException: 
/localhome/jrockits/R28.0.0_R28.0.0-454 1.6.0/jre/classes 

[INFO ] [excepti] [00004] java/lang/ArrayIndexOutOfBoundsException: 6 
[INFO ] [excepti] [00004] java/lang/ArithmeticException: / by zero 
[INFO ] [excepti] [00004] java/lang/ArithmeticException: fisk 
[INFO ] [excepti] [00004] java/lang/ArrayIndexOutOfBoundsException: 11 
[INFO ] [excepti] [00004] java/lang/RuntimeException: fisk 


上 面 的 示例 内 容 中 , 每 行 都 记录 了 抛 出 的 异常 ， 若 想 跟踪 异常 的 抛 出 轨迹 ， 可 以 使 用 命令 行 
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= 冰 


数 -Xverbose:exceptions=debug。JRockit Mission Control 套件 也 包含 了 可 以 分 析 异 常 的 框 
， 而 且 使 用 方式 更 加 人 性 化 。 示 例如 下 : 


hastur:~ marcus$ java -Xverbose:exceptions=debug Jvm98Wrapper _200_ check 
[DEBUG] [excepti] [00004] java/lang/ArrayIndexOutOfBoundsException: 6 
at spec/jbb/validity/PepTest.testArray()Ljava/lang/String; 
(Unknown Source) 
at spec/jbb/validity/PepTest.instanceMain()V(Unknown Source) 
at spec/jbb/validity/Check.doCheck()Z(Unknown Source) 
at spec/jbb/JBBmain.main([Ljava/lang/String; )V(Unknown Source) 
at jrockit/vm/RNI.c2java(JJJJJ)V(Native Method) 
--- End of stack trace 
[DEBUG] [excepti] [00004] java/lang/ArithmeticException: / by zero 
at jrockit/vm/Reflect.fillInStackTrace0 (Ljava/lang/Throwable; ) 
vV(Native Method) 
at java/lang/Throwable.filliInStackTrace()Ljava/lang/Throwable; 
(Native Method) 
at java/lang/Throwable.<init>(Throwable.java:196) 
at java/lang/Exception.<init> (Exception. java:41) 
at java/lang/RuntimeException.<init>(RuntimeException.java:43) 
at java/lang/ArithmeticException.<init>(ArithmeticException. java: 36) 
at jrockit/vm/RNI.c2java(JJJJJ)V(Native Method) 
at jrockit/vm/ExceptionHandler.throwPendingType()V(Native Method) 
at spec/jbb/validity/PepTest.testDiv()Ljava/lang/String; 
(Unknown Source) 
at spec/jbb/validity/PepTest.instanceMain()V(Unknown Source) 
at spec/jbb/validity/Check.doCheck()Z(Unknown Source) 
at spec/jbb/JBBmain.main([Ljava/lang/String; )V(Unknown Source) 
at jrockit/vm/RNI.c2java(JJJJJ)V(Native Method) 
--- End of stack trace 
[DEBUG] [excepti] [00004] java/lang/ArithmeticException: fisk 
at spec/jbb/validity/PepTest.testExc1()Ljava/lang/String; 
(Unknown Source) 
at spec/jbb/validity/PepTest.instanceMain()V(Unknown Source) 
at spec/jbb/validity/Check.doCheck()Z(Unknown Source) 
at spec/jbb/JBBmain.main([Ljava/lang/String; )V(Unknown Source) 
at jrockit/vm/RNI.c2java(JJJJJ)V(Native Method) 
--- End of stack trace 
[DEBUG] [excepti] [00004] java/lang/ArrayIndexOutOfBoundsException: 11 
at spec/jbb/validity/PepTest.testExc1()Ljava/lang/String; 
(Unknown Source) 
at spec/jbb/validity/PepTest.instanceMain()V(Unknown Source) 
at spec/jbb/validity/Check.doCheck()Z(Unknown Source) 
at spec/jbb/JBBmain.main([Ljava/lang/String; )V(Unknown Source) 
at jrockit/vm/RNI.c2java(JJJJJ)V(Native Method) 
--- End of stack trace 
[DEBUG] [excepti] [00004] java/lang/RuntimeException: fisk 
at spec/jbb/validity/PepTest.testExc2()Ljava/lang/String; 
(Unknown Source) 
at spec/jbb/validity/PepTest.instanceMain()V(Unknown Source) 
at spec/jbb/validity/Check.doCheck()Z(Unknown Source) 
at spec/jbb/JBBmain.main([Ljava/lang/String; )V(Unknown Source) 
at jrockit/vm/RNI.c2java(JJJJJ)V(Native Method) 
--- End of stack trace 
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JRockit Flight Recorder 中 也 包含 了 异常 分 析 功 能 , 可 以 用 JRockit Mission Control 来 分 析 相 关 
内 容 。 


5.7.10 AWK 


有 时 候 ， 为 大 对 象 分 配 内 存 时 ， 并 不 使 用 TLA， 而 是 直接 分 配 在 堆 中 。 这 是 因为 一 般 情 况 
下 TLA 的 容量 并 不 大 , 在 TLA 分 配 大 对 象 会 导致 将 对 象 提升 到 堆 中 的 操作 过 于 频繁 ， 带 来 不 必 
要 的 执行 开销 。 就 耻 ockit 来 说 ,在 R28 版 本 之 前 ， 会 显 式 设 定 大 对 象 的 浆 值 ， 凡 是 小 于 此 阔 值 
的 对 象 才 会 分 配 在 TLA 中 。 从 R28 版 本 起 ， 使 用 浪费 限额 控制 TLA 中 大 对 象 的 分 配 策略 。 

把 大 对 象 分 配 在 堆 中 其 实 也 不 能 高 枕 无 忧 , 它们 会 加 速 堆 的 碎片 化 , 因为 大 对 象 可 能 无 法 填 
补 空闲 列表 中 回收 小 对 象 后 留 下 的 空 际 。 

如 果 堆 的 碎片 化 比较 严重 , 为 对 象 分 配 内 存 的 时 间 就 会 大 幅 增 长 ， 而 大 对 象 本 身 又 会 加 速 碎 
片 化 的 进程 。 此 外 ， 由 于 大 对 象 会 跳 过 TLA 而 直接 分 配 在 堆 中 ,分 配 内 存 的 操作 时 可 能 会 参与 
对 堆 的 全 局 锁 的 竞争 ， 从 而 增加 了 执行 开销 。 

在 最 坏 情况 下 , 滥用 大 对 象 会 导致 垃圾 回收 带 频 繁 地 对 整个 堆 执行 垃圾 回收 ,此 举 破坏 性 极 
强 ， 会 长 时 间 中 断 应 用 程序 的 运行 。 

对 于 给 定 的 应 用 程序 来 说 ， 很 难 找到 一 个 大 对 象 的 阔 值 能 适用 于 所 有 情况 ， 因 此 在 JRockit 
中 ,这 个 阔 值 (从 R28 版 本 起 改 为 浪费 限额 ) 是 会 变化 的 。 这 种 机 制 非常 有 用 ,例如 当 自 适应 运 
行 时 发 现 有 相当 一 部 分 对 象 的 大 小 比 默认 值 稍 大 时 ， 或 者 自 适 应 运行 时 期 望 TLA 中 内 容 能 更 紧 
密 地 排列 时 ， 就 可 以 通过 修改 这 个 效 值 〈 或 浪费 限额 ) 来 达到 目的 。 

当 频 繁 出 现 MB 级 别 的 大 对 象 时 ,最 糟糕 的 情况 发 生 了 , 典型 场景 是 在 堆 中 存储 了 数据 库 查 
询 结果 ,或 是 使 用 非常 大 的 数组 。 记 住 ， 坚决 避免 这 种 用 法 ， 即 使 是 专门 实现 一 个 本 地 存储 层 来 
放置 超大 对 象 ， 也 不 要 将 这 么 大 的 对 象 放 在 堆 中 。 


5.7.11 本 地 内 存 与 堆 内 存 


对 于 JVM 来 说 ， 所 有 的 内 存 都 是 来 自 于 操作 系统 的 系统 内 存 ，JVM 将 其 中 一 部 分 用 来 实现 
堆 ， 堆 大 小 的 初始 值 和 最 大 值 可 分 别 通 过 命令 行 参数 -xms 和 -xmx 来 设置 。 

当 系 统 内 存 不 足以 完成 JVM 内 部 的 某 些 操 作 , 或 JVM 无 法 为 对 象 在 堆 中 分 配 到 足够 的 内 存 
时 ，JVM 会 抛 出 outofMemoryError 错误 。 

作为 一 个 本 地 应 用 程序 ，JVM 本 身 也 会 消耗 一 些 系统 内 存 ， 例 如 代码 优化 操作 等 。 从 很 大 
程度 上 , JVM 内 部 的 内 存 管理 是 独立 于 Java 堆 之 外 的 , 通过 类 似 malloc 的 系统 调用 从 系统 内 存 中 
直接 分 配 ， 这 部 分 由 SVM 直接 分 配 的 、 并 非 作为 堆 使 用 的 系统 内 存 称 为 本 地 内 存 ( native memory )。 

堆 内 存 可 以 由 JVM 的 垃圾 回收 器 来 回收 ,而 本 地 内 存 却 不 行 。. 如 果 所 有 的 本 地 内 存 都 由 JVM 
自己 来 管理 ,而且 JVM 在 使 用 本 地 内 存 时 又 足够 聪明 的 话 ， 那 就 万 事 大 吉 了 , 但 现实 是 残酷 的 。 

在 某 些 场景 中 ， 本 地 内 存 可 能 会 被 耗 尽 。 例 如 JVM 的 代码 优化 是 最 耗费 本 地 内 存 的 操作 之 
一 ， 即 使 仅 运 行 IT 优化 和 基于 单个 方法 的 代码 优化 也 有 可 能 耗 尽 本 地 内 存 。 此 外 ， 还 有 一 些 其 
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他 的 机 制 可 以 让 Java 操作 本 地 内 存 , 壁 如 JNI, 如 果 JNI 调 用 malloc 时 分 配 了 一 块 很 大 的 内 存 ， 
则 在 其 被 释放 掉 之 前 ，JVM 本 身 是 无 法 使 用 这 块 内 存 的 。 


| JRockit 中 包含 了 跟踪 本 地 内 存 使 用 率 的 机 制 ， 可 以 通过 JRockit Mission | 




















Control 或 JRCMD 查看 相关 信息 ， 其 中 的 直方 图 显示 了 本 地 内 存 的 使 用 情况 。 








如 果 堆 设置 得 太 大 ， 有 可 能 会 导致 JVM 留 给 自己 用 来 做 舌 记 或 代码 优化 等 操作 的 本 地 内 存 
不 太 够 用 。 此 时 ,JVM 别 无 他 法 ， 只 好 从 本 地 代码 中 抛 出 outofMemoryError 错误 。 就 JRockit 
来 说 ， 可 以 通过 降低 命令 行 参数 -Xmx 的 值 来 隐 式 地 增加 本 地 内 存 的 可 用 量 。 




















5.8 wait Ask, notify 方法 与 胖 锁 





第 4 章 介绍 过 , 在 Rockit H, wait 和 notify 方法 总 会 将 瘦 锁 膨胀 为 胖 锁 。 如 果 应 用 程序 
频 索 对 某 个 锁 执 行 加 锁 和 释放 的 操作 ， 而 且 持 有 锁 的 时 间 又 很 短 ， 则 最 好 将 之 实现 为 瘦 锁 。 
因此 ， 在 新 创建 的 对 象 上 调用 wait 和 notify 方法 会 生成 一 个 监视 需 以 及 胖 锁 ， 从 而 人 带 来 性 能 
损耗 。 


5.8.1 推 的 大 小 设置 不 当 


在 设置 JVM 参数 时 ， 如 果 堆 的 大 小 设置 不 当 ， 也 会 引起 性 能 问题 。 如 果 堆 设置 得 太 小 ， 就 
会 频繁 引发 垃圾 回收 ， 把 时 间 都 花费 在 执行 垃圾 回收 上 了 ; 如 果 堆 设置 得 太 大 ， 则 执行 垃圾 回收 
的 平均 时 间 就 会 延长 ,可 能 会 导致 JVM 抛 出 OutofMemoryError 错误 。 因 此 , 分 析 应 用 程序 的 
行为 , 找 出 最 合适 的 堆 大 小 是 很 有 意义 的 。JRockit Mission Control 套件 可 以 通过 分 析 应 用 程序 的 
行为 得 出 与 内 存 使 用 相关 的 数据 。 


5.8.2 ”存活 对 象 过 多 


正如 在 第 3 章 介绍 的 , 在 自动 内 存 管 理 系 统 中 , 运行 时 的 复杂 度 主要 取决 于 堆 中 存活 对 象 的 
总 量 ， 而 不 是 堆 本 身 的 大 小 , 大 量 的 存活 对 象 几乎 总 是 会 增 大 垃圾 回收 的 执行 开销 。 内 存 分 析 可 
以 帮助 找 出 那些 本 应 该 被 回收 掉 的 大 对 象 , JRockit Mission Control 套件 中 的 内 存 泄漏 分 析 工 具 就 
可 以 很 好 地 完成 这 个 任务 。 














































































































5.8.3 Java 并 非 万 能 


Java 是 一 门 强大 的 通用 编程 语言 , 因 其 友好 的 语义 和 内 建 的 内 存 管理 而 大 大 加 快 了 应 用 程序 
的 开发 进度 ,但 Java 不 是 万 能 的 ， 这 里 来 谈 谈 不 宜 使 用 Java 解决 的 场景 。 
口 要 开发 一 个 有 近 实 时 性 要 求 的 电信 应 用 程序 ， 并 且 其 中 会 有 成 千 上 万 个 线程 并 发 执行 。 
口 应 用 程序 的 数据 库 层 所 返回 的 数据 经 常 是 20 MB 的 字 节 数组 。 
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口 应 用 程序 性 能 和 行为 的 确定 性 ， 完 全 依赖 于 底层 操作 系统 的 调度 器 ， 即 使 调度 语义 有 微 

小 变化 也 会 对 应 用 程序 性 能 产生 较 大 影响 。 

口 开发 设备 驱动 程序 。 

QO 使 用 C/Fortran/COBOL 等 语言 开发 的 历史 遗留 代码 太 多 ， 目 前 团队 手中 还 没有 好 用 的 工 

具 可 以 将 这 些 代 码 转 换 为 Java 代码 。 

口 应 用 程序 的 并 发 程度 很 高 ， 即 按照 分 治 策略 ， 在 最 终 融 合 各 个 子 问 题 的 结果 之 前 ， 使 用 
成 千 上 万 个 线程 共同 计算 。 

除了 上 面 的 示例 外 , 还 有 其 他 很 多 场景 不 适宜 使 用 Java。 通过 JVM 对 底层 操作 系统 的 抽象 ， 

Java 实现 了 “一 次 编写 ， 到 处 运行 ”， 也 因此 受到 了 广泛 关注 。 但 夸大 一 点 说 ，ANSIC 也 能 做 到 

这 一 点 ， 只 不 过 在 编写 源 代 码 时 ， 要 花 很 多 精力 来 应 对 可 移植 性 问题 。 因 此 要 结合 实际 场景 选择 

合适 的 工具 。Java 是 好 用 ， 但 也 不 要 滥 













































































5.9 小 结 














本 章 主要 介绍 了 基准 测试 和 性 能 调 优 的 相关 内 容 。 这 里 提 到 了 使 用 基准 测试 主要 是 为 了 防止 
应 用 程序 的 性 能 在 开发 过 程 中 发 生 衰退 , 而 且 相 比 于 处 理 整 个 应 用 程序 , 分析、 测试 其 中 的 某 一 
部 分 问题 会 方便 得 多 。 之 后 重点 强调 了 在 商业 软件 开发 中 , 制定 性 能 目标 的 重要 性 ， 以 及 基准 测 
试 在 这 其 中 所 能 发 挥 的 重要 作用 。 另 外 ,在 基准 测试 套件 中 集成 一 些 第 三 方 应 用 程序 也 很 有 帮助 。 

本 章 简单 介绍 了 微 基 准 测试 及 其 使 用 场景 ， 并 讨论 了 确定 测试 目标 的 重要 性 。 

为 了 定位 应 用 程序 的 性 能 瓶颈 , 并 确保 基准 测试 确实 能 解决 它们 ,对 应 用 程序 做 性 能 分 析 是 
很 有 必要 的 。 性 能 分 析 可 以 按照 复杂 度 和 侵入 性 划分 为 不 同 的 级 别 。 就 JRockit 来 说 ,使 用 JRockit 
Mission Control 套件 可 以 以 较 小 的 代价 分 析 应 用 程序 的 性 能 。 

本 章 还 继续 介绍 了 几 种 工业 基准 测试 套件 , 特别 是 SPEC 相关 套件 , 及 各 自 特点 和 使 用 场景 。 

在 知晓 了 应 用 程序 的 运行 行为 后 ， 可 以 根据 实际 情况 决定 ， 是 单纯 靠 调 整 JVM 参数 来 提升 
性 能 ， 还 是 需要 重 写 应 用 程序 的 某 些 功能 模块 。 本 章 以 JRockit 为 例 ， 介 绍 了 内 存 系统 和 代码 生 
成 带 等 JVM 组件 的 命令 行 参数 。 

最 后 ， 介 绍 了 Java 应 用 程序 中 常见 的 性 能 瓶颈 和 反 模 式 ， 并 讨论 了 规避 这 些 问题 的 方法 。 

到 这 里 ， 本 书 的 第 一 部 分 就 此 完结 。 在 下 一 部 分 中 ， 将 会 详细 介绍 JRockit Mission Control 
这 个 强大 的 工具 。 期 望 本 章 中 的 内 容 可 以 帮助 读者 理解 基准 测试 的 作用 , 以 及 如 何 使 用 正确 的 工 
具 解 决 性 能 问题 。 



















































































第 6 章 
JRockit Mission Control 套件 








作为 Java 运行 时 , 人 们 期 望 耻 ockit 能 够 持续 稳定 地 监控 Java 应 用 程序 的 运行 情况 。 正 如 之 前 
几 章 介绍 的 ， 在 Java 应 用 程序 运行 的 过 程 中 ，JRockit 有 很 多 事情 要 做 ， 例 如 找 出 哪些 方法 最 耗 时 
间 ,以 及 跟踪 内 存 使 用 情况 和 应 用 程序 的 内 存 分 配 行为 ,否则 如 果 发 生 内 存 泄漏 的 情况 就 不 太 妙 了 。 
在 对 应 用 程序 做 性 能 分 析 或 诊断 时 ， 耻 ockit 所 收集 到 的 运行 时 数据 将 会 是 非常 宝贵 的 资料 。 
在 本 书 的 第 二 部 分 中 ， 将 会 详细 介绍 JRockit 所 提供 的 套件 工具 。 在 接 下 来 的 章节 中 ， 将 介 
绍 JRockit 发 行 版 中 的 工具 , 分 别 是 JRockit Mission Control Console, JRockit Runtime Analyzer( 在 
R28 版 本 中 , 该 工具 已 被 JRockit Flight Recorder 取代 ), JRockit Memory Leak Detector 和 JRCMD. 
上 述 的 前 3 个 工具 均 包 含 在 JRockit Mission Control 套件 中 ， 而 最 后 一 个 ， 即 及 CMD ， 是 一 
个 命令 行 工 具 , 随 JRockit JDK 一 起 发 布 。 这 些 工 具 都 可 以 连接 到 正在 运行 的 JYM 上 完成 各 自 的 
THE, JVM 或 应 用 程序 无 须 预先 配置 。 此 外 ， 它 们 的 执行 开销 都 非常 小 ， 可 以 应 用 于 生产 环境 。 
本 章 的 主要 知识 点 包括 : 
口 JRockit Mission Control 的 两 种 启动 方式 ， 即 独立 启动 和 作为 Eclipse Ide 的 插件 启动 
口 配置 Rockit JVM 以 便 通过 TRockit Mission Control 进行 远程 管理 
O 配置 JRockit Mission Control 使 其 自动 发 现 其 他 正在 运行 的 远程 JRockit JVM 
口 配置 JRockit JVM 中 的 管理 代理 (management agent ) 
口 如 何在 安全 环境 中 使 用 JRockit Mission Control 和 JRockit Management Agent 
口 处 理 JRockit Mission Control 和 JRockit JVM 的 连接 问题 
口 如 何 从 JRockit Mission Control 中 获取 更 多 调试 信息 
口 介绍 JRockit Mission Control 的 Experimental Update Site， 以 及 如 何 扩 展 JRockit Mission 
Control 
本 章 的 部 分 内 容 涉及 Eclipse IDE, 希望 读者 能 预先 了 解 一 下 相关 内 容 。 更 多 与 Eclipse IDE 
相关 的 内 容 请 参见 Eclipse 主页 。 
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6.1 背景 介绍 


起 初 ，JRockit Mission Control 只 是 JRockit 开发 团队 用 来 监控 和 调试 Rockit JVM 的 内 部 工 
具 集 。 这 些 分 析 工 具 本 身 并 非 为 用 户 而 开发 ,不 过 在 为 高 端 用 户 解决 了 不 少 问题 后 ， 顿 时 威名 远 
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扬 。 同 时 开发 团队 意识 到 , 这 些 工 具 对 用 户 分 析 其 应 用 程序 是 很 有 帮助 的 ,于 是 他 们 将 这 些 分 析 
工具 做 得 更 加 易 用 ， 更 具 模 块 性 ， 并 作为 Java 相关 工具 随 JRockit JDK 一 起 发 布 ， 这 就 是 后 来 的 
JRockit Mission Control, 

如 今 ，JRockit Mission Control 套件 集 监控 、 管 理 和 分 析 功 能 于 一 身 , 还 可 以 跟踪 分 析 内 存 泄 
漏 。 它 能 够 以 非常 小 的 执行 开销 获取 到 应 用 程序 的 运行 时 数据 。 相 比 之 下 , 大 部 分 其 他 的 分 析 工 
具 都 会 严重 拖 慢 应 用 程序 的 运行 ,进而 改变 了 应 用 程序 原 有 的 行为 。 正 如 第 5 章 中 提 到 的 ， 如 果 
分 析 工 具 的 执行 开销 过 大 , 那么 最 终 观测 到 的 就 不 是 应 用 程序 真实 的 行为 了 , 而 是 应 用 程序 和 分 
析 工 具 共 同 作用 的 结 















































由 于 做 性 能 分 析 而 改变 应 用 程序 运行 行为 的 现象 可 以 归 为 观察 者 效应 
( observer effect )， 即 观察 者 改变 了 被 观察 者 的 行为 。 有时， 也 称 观察 者 效应 为 海 
森 堡 效应 ( heisenberg effect )， 或 统称 为 海 森 堡 不 确定 性 原理 〈heisenberg 
uncertainty principle )。 
在 BEA 被 Oracle 收购 之 前 , BEA 的 性 能 团队 内 部 测试 了 不 同 的 性 能 分 析 工 
> FL, A T1% WebLogic 服务 器 上 J2EE 应 用 程序 的 基准 测试 更 加 精确 ， 性 能 团队 
一 直 在 寻找 执行 开销 较 低 的 分 析 工 具 。 他 们 筛选 出 几 种 不 同 的 分 析 工 具 , 并 通过 
基准 测试 计算 了 性 能 分 析 工 具 的 执行 开销 , 结果 显示 Mission Control 的 执行 开销 
是 0.5%， 测 试 结果 中 排名 第 二 的 是 另 一 款 比较 著名 的 Java 分 析 器 ， 但 其 执行 开 
销 却 高 达 93.8%。 


6.1.1 采样 分 析 与 准确 分 析 


一 般 来 说 , 不 同 的 工具 有 不 同 的 适用 场景 。JRockit Mission Control 所 收集 到 的 数据 只 是 在 统 
计 学 意义 上 ， 展 示 出 JRockit VM 当前 的 运行 状态 ,虽然 并 非 完 全 准确 ,但 也 可 以 为 解决 各 种 问 
题 提供 必要 的 信息 了 。 这 种 分 析 方 式 即 所 谓 的 采样 分 析 ( sampling-based profiling )， 适 用 于 周期 
性 记录 目标 的 状态 。 耻 ockit Mission Control 套件 中 最 常用 的 是 基于 时 间 的 采样 ( time-based 
sampling ) 和 基于 状态 改变 子 集 的 采样 (sampling based on a subset of state change )。 作 为 一 个 巨 
大 的 状态 机 ，JVM 可 以 以 较 低 的 开销 提供 大 量 的 采样 信息 和 事件 信息 供 分 析 人 员 使 用 。 此 外 ， 
使 用 采样 分 析 的 男 一 个 好 处 是 可 以 很 容易 地 评估 分 析 本 身 的 执行 开销 。 

例如 ,使 用 JRockit Flight Recorder 工具 排查 热 方 法 列表 (hot method list ) 可 以 很 容易 地 确定 
应 用 程序 主要 把 时 间 花 在 了 哪里 。 通 过 统计 代码 分 析 线 程 提供 的 数据 , 可 以 给 出 热 方法 列表 , 不 
过 却 无 法 给 出 每 个 方法 的 调用 信息 及 执行 该 方法 的 精确 时 间 信 息 。 

除了 采样 分 析 外 ，JRockit Mission Control 还 可 以 执行 准确 分 析 (exact profiling )， 但 启用 准 
确 分 析 可 能 会 有 较 大 的 执行 开销 。 例 如 ， 可 以 使 用 Rockit Management Console 连接 到 正在 运行 
的 应 用 程序 ( 但 注意 不 要 在 生产 环境 这 么 做 ), 对 系统 中 的 每 个 方法 启用 准确 计时 和 调用 计数 器 ， 
不 过 执行 准确 分 析 会 产生 额外 的 运行 时 开销 。 对 系统 的 中 的 每 个 方法 启用 准确 分 析 需 要 JVM Æ 
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成 并 执行 大 量 额外 的 分 析 代 码 , 这 不 仅 会 影响 系统 性 能 ， 而 且 也 很 难 确 定 分 析 代 码 自身 对 系统 产 
生 了 哪些 影响 。JRockit 中 有 一 部 分 代码 是 用 Java 写 的 ， 如 果 对 所 有 内 存 分 配 和 锁 操 作 代码 都 做 
分 析 的 话 , 应 用 程序 肯定 就 无 法 正常 工作 了 。 如 果 是 为 了 确定 当前 最 需要 对 应 用 程序 的 哪 部 分 做 
优化 ， 还 是 使 用 采样 分 析 更 合适 。 

人 们 可 能 会 说 ， 虽 然 准确 分 析 带 来 了 不 小 的 开销 , 却 可 以 更 好 地 完成 分 析 任 务 。 例 如 , 在 给 
定 准确 数据 的 情况 下 , 可 以 测量 出 系统 中 所 有 方法 的 执行 时 间 , 将 方法 的 调用 次 数 乘 以 执行 时 间 ， 
再 排 个 序 ， 不 就 可 以 确定 出 优化 目标 了 吗 ? 

但 事实 上 , 在 一 个 足够 复杂 的 系统 中 ， 上述 测 量 所 得 到 的 数据 未 必 是 真实 有 效 的 。 启 用 准确 
采样 后 ， 系 统 中 关键 路 径 上 方法 的 执行 开销 会 迅速 增 大 ,并 导致 系统 的 整体 性 能 下 降 。 此 外 , 对 
系统 中 每 个 方法 都 做 准确 详细 的 分 析 很 可 能 会 严重 改变 应 用 程序 原 有 的 行为 , 导致 无 法 得 到 准确 
的 测量 结果 。 







































































就 JRockit Mission Control 来 说 ，Management Console 工具 算是 个 特例 ， 因 
为 使 用 它 来 获取 方法 的 准确 执行 时 间 和 调用 次 数 时 ， 难 以 评估 其 自身 的 执行 开 
销 。 它 分 析 数 据 的 时 间 可 以 认为 是 常数 ,统计 方法 调用 次 数 的 代码 一 般 会 被 放置 
QS 在 方法 的 入 口 点 和 出 口 点 ， 因 此 测量 结果 的 失真 程度 正比 于 方法 的 执行 频率 ， 反 
比 于 方法 的 执行 时 间 。 如 果 方 法 被 频繁 调用 , 测量 的 额外 的 开销 就 是 显著 的 影响 
AA; 如 果 目 标 方法 已 经 执行 了 很 长 时 间 了 ， 额 外 的 开销 也 就 显得 无 足 轻重 了 。 
在 多 线程 场景 下 ，Management Console 的 准确 分 析 所 导致 的 不 确定 性 会 更 大 。 


6.1.2 用途 广泛 


JRockit Mission Control 的 适用 范围 很 广 ， 外 界 往往 将 其 作为 一 款 功能 强大 的 分 析 工 具 使 用 。 

有 些 用 户 使 用 JRockit Mission Control 来 追踪 应 用 程序 的 问题 ， 这 也 是 Oracle 支持 服务 的 主 
要 工作 内 容 。 此 外 ， 在 开发 JRockit Mission Control 时 ， 还 可 以 使 用 JRockit Mission Control 来 发 
现 自身 潜在 的 性 能 问题 和 故障 。 

当然 ， 还 有 一 些 像 作者 一 样 的 极 客 ， 他 们 会 综合 运用 IRockit Mission Control 和 基准 测试 ， 
为 特定 的 应 用 程序 调 优 JVYM， 竭 力 挖掘 出 JRockit JVM 的 所 有 性 能 。 

下 面 是 JRockit Mission Control 的 典型 适用 场景 。 

口 找 出 热点 : 优化 应 用 程序 时 应 从 哪里 人 手 ? 应 用 程序 中 所 出 现 的 问题 ， 是 在 吞吐 量 方面 还 

是 在 响应 延迟 方面 ? 应 用 程序 中 哪个 方法 的 执行 次 数 最 多 ， 是 否 是 最 需要 优化 的 地 方 ? 

口 跟踪 延迟 : 找 出 应 用 程序 否 叶 量 不 足 或 响应 延迟 过 长 的 原因 。 如 果 应 用 程序 的 否 叶 量 问 
题 与 延迟 相关 ， 则 很 有 可 能 CPU 处 于 不 饱和 工作 状态 。 过 分 依赖 于 同步 操作 可 能 会 使 线 
程 发 生死 锁 。 为 什么 工作 线程 在 大 部 分 时 间 里 都 是 处 于 阻塞 状态 的 ? 为 什么 在 CPU 使 用 
率 只 有 20% 时 ， 系 统 就 已 经 无 法 对 请 求 进 行 响应 了 ? 

口 内 存 分 析 : 在 查找 JVM 执行 垃圾 回收 的 原因 时 非常 有 用 。 内 存 系统 的 压力 来 自 哪里 ?应 
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用 程序 的 哪 部 分 功能 最 容易 导致 垃圾 回收 ?9 JVM 执行 垃圾 回收 花费 了 多 少时 间 ? 垃圾 回 
收 周期 各 个 阶段 的 时 间 消 耗 是 多 少 ? 堆 中 碎片 化 的 情况 如 何 ? 

口 异常 分 析 : 大 量 抛 出 并 处 理 不 必要 的 异常 会 给 系统 带 来 不 小 的 负担 。 系 统 到 底 抛 出 了 多 

少 异常 ? 异常 都 来 自 哪 里 ? 剔除 不 必要 的 异常 通常 会 给 系统 带 来 巨大 的 性 能 提升 。 

O 堆 分 析 : 分 析 应 用 程序 各 个 运行 阶段 中 ， 堆 里 面 存储 了 何 种 类 型 的 数据 ， 有 助 于 确定 应 
该 选择 何 种 垃圾 回收 策略 或 内 存 整 理 策略 。 此 外 ， 分 析 堆 中 的 数据 还 可 以 发 现 是 否 使 用 
了 过 多 的 引用 对 象 。 乔 治 ,为 什么 你 的 股票 报价 缓存 中 有 一 个 HashMap 对 象 , 它 占 了 96% 
的 堆 内 存 ? 顺便 说 一 下 ， 它 仍 在 增 大 。 以 这 个 速度 ， 我 预计 两 个 小 时 之 内 会 宕 机 。 看 样 
子 我 们 需要 每 礼拜 重启 两 次 ? WA, 没关系， 大 家 都 会 这 样 ……” 

口 调 优 内 存 系统 : 一 般 来 说 ， 各 JVM 实现 中 的 内 存 系统 本 身 已 经 做 得 很 好 了 ， 但 如 果 能 针 
对 应 用 程序 的 特点 适当 地 调 优 ， 就 能 使 应 用 程序 获得 更 高 的 性 能 。 对 于 一 些 特殊 的 应 用 
程序 来 说 ， 为 了 达到 指定 的 性 能 要 求 ， 调 优势 在 必 行 ， 这 时 JRockit Mission Control 可 以 
快速 定位 当前 的 性 能 瓶颈 。 









































6.2 ”概述 


JRockit Mission Control 的 4.0 版 本 中 包含 以 下 组 件 。 

口 The JRockit Management Console: 通常 作为 监控 JVM 和 应 用 程序 的 控制 台 使 用 。 

Management Console 支持 自 定义 图 形 ， 触 发 规则 (用户 可 以 自 定 义 触 发 条 件 ) 等 特性 。 

口 JRockit Flight Recorder: 常 称 为 Flight Recorder 或 JFR, 以 很 低 的 执行 开销 记录 下 JRockit 
JVM 的 运行 状态 ， 并 通过 JRockit Mission Control GUI 导出 记录 数据 以 便 做 离线 分 析 。 
JRockit Flight Recorder 取代 老 版 本 的 JRockit Runtime Analyzer (在 R27x 和 3.x 之 前 的 
版 本 )， 成 为 整个 套件 最 主要 的 分 析 工 具 。 

口 JRockit Memory Leak Detector: 或 简称 为 Memleak， 是 一 款 功能 强大 的 在 线 堆 分 析 髓 ， 

以 可 视 化 的 形式 展现 了 内 存 的 使 用 趋势 ， 以 及 堆 中 不 同类 的 实例 之 间 的 关系 等 信息 。 通 
过 分 析 系 统 中 每 种 类 型 的 存活 对 象 的 运行 趋势 ， 即 使 是 很 小 的 内 存 泄 漏 问题 Memleak 
也 可 以 迅速 检测 出 来 。 

JRockit Mission Control 包含 两 个 主要 模块 ， 一 套 API, 与 一 套 内 建 于 JRockit JVM 和 JRockit 
Mission Control 客户 端 中 的 协议 和 代理 。 不 同 的 工具 使 用 不 同 的 API， 但 都 通过 JMX 与 JRockit 
JVM 通信 。 

这 里 简单 介绍 JMX 的 基本 概念 ， 详 细 内 容 超 出 本 书 的 范畴 ， 此 处 不 再 歼 述 。JMX 包含 以 下 
层级 。 
O 设 备 层 (instrumentation level ): 应 用 程序 在 这 一 层 暴 露出 需要 通过 MBean( managed bean ) 
管理 的 资源 。MBean 是 JavaBean 的 一 种 特例 ， 包 含 了 属性 、 操 作 和 通知 机 制 。 

口 代理 层 (agent level): 代理 是 用 于 管理 MBean 的 组 件 ， 最 重要 的 代理 层 组 件 是 MBean 
服务 器 (MBean server )， 用 于 注册 和 管理 MBean。 
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O 远程 管理 层 (remote management level): 该 层级 提供 了 可 用 于 MBean 服务 器 和 远 端 SVM 
通信 的 协议 适配器 。 
下 面 是 部 署 JRockit 时， 不 同 JMX 层级 的 应 用 示意 图 。 
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6.2.1 JRockit Mission Control 的 服务 器 端 组 件 


从 JRockit Mission Control 的 角度 看 ， 受 监控 的 JRockit JVM 主要 包含 以 下 几 个 部 分 。 
口 一 套 服务 器 端 API 
m JMXMAPI: JRockit JVM 对 MBean 服务 器 中 MBean 实现 的 扩展 , 有关 MBean 和 MBean 
服务 器 的 内 容 会 在 第 7 章 介 绍 。 
m JRockit 内 部 的 JavaAPI: 例如 JRockit Management API ( JMAPI )。 
mw 服务 器 端的 本 地 API: 一 套 内 建 于 JRockit JVM 中 的 非 标准 JavaAPI， 例 如 Memleak 中 
所 使 用 的 本 地 API。 
口 提供 上 述 API 和 其 他 服务 的 代理 
m 默认 的 JMX 代理 。 
m Memleak 服务 器 ( memleak server ): 一 个 本 地 服务 器 , 通过 MemLeak Protocol ( MLP ) 
协议 对 外 暴露 出 Memleak API 接 口 。 
m JDP 服务 器 ( JRockit discovery protocol server ): 一 个 可 选 的 服务 ， 用 于 在 网 络 中 广 提 
JVM 实例 的 位 置 。 









































6.2.2 JRockit Mission Control 的 客户 端 组 件 





作为 JRockit Mission Control 的 2.0 版 本 ，JRMC 基于 Eclipse RCP (rich client platform ) 技术 
开发 ， 本 身 有 很 多 架构 上 的 优势 。 例 如 基于 OSGi 的 组 件 模 型 ， 运 行 JRockit Mission Control 时 ， 
可 以 作为 独立 的 应 用 程序 运行 ， 也 可 以 能 入 到 Eclipse 中 运行 。 
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Mission Control 2.0 内 部 代号 是 “Energy”， 意 为 已 = mc*。 就 是 这 么 酷 ! 
RCP 是 Eclipse 的 基础 平台 ， 它 包括 SWT (standard widget toolkit )、JFace、 
Equinox (OSGi 的 Eclipse 实现 ) 和 一 套 交 付 、 更 新 RCP 应 用 程序 的 内 建 机 制 。 
OSGi 是 一 套 有 很 多 大 公司 支持 的 、 标 准 化 的 动态 模块 系统 ,而 RCP 使 用 户 可 以 
像 编 写本 地 应 用 程序 一 样 编写 、 交 付 高 度 模 块 化 的 OSGi 应 用 程序 。 
更 多 有 关 RCP 的 内 容 , 请 参见 http://www.eclipse.org/home/categories/rcp.php， 
AX OSGi 的 内 容 ， 请 参见 http://www.osgi.org/。 











JRockit Mission Control 的 客户 端 程序 具有 高 度 的 模块 化 结构 , 可 以 非常 容易 地 舱 入 新 的 插件 
工具 ， 或 对 自身 扩展 开发 。 
从 JRockit Mission Control 的 角度 看 ， 客 户 端 包含 以 下 几 个 部 分 。 
O RCP: Eclipse Rich Client Platform 
O 客户 端 API 
m RJMX: 扩展 的 JMX 服务 ， 例 如 MBean 属性 的 订阅 框架 、 触 发 器 、 代 理 和 旧版 RMP 
协议 〈 在 Rockit 1.4 版 本 中 使 用 )。 
= Memleak API: 一 套 与 Memleak 服务 器 通信 的 API. 
a Flight Recorder Model: 用 于 解析 JRockit Flight Recorder 记录 的 内 容 。 
m JDP Client API: 用 于 检测 网 络 中 正在 运行 的 JRockit 实例 。 
口 JRockit Mission Control 核心 : 包含 了 JRockit Mission Control 客户 端的 核心 框架 ， 定义 
了 核心 扩展 点 。 
O JVM 浏览 器 : 持续 跟踪 监测 到 的 或 用 户 自 定义 的 JVM 连接 信息 。 
口 各 种 工具 : 可 以 从 JVM 浏览 器 中 启动 的 各 种 工具 ， 例 如 Management Console, Flight 
Recorder 和 Memleak。 
下 图 展示 了 JRockit Mission Control 4.0.0 版 本 中 各 部 分 的 结构 。 
































Eclipse / Equinox 
com.jrockit.mc.console.* 


com.jrockkit.mc.browser | A re oe 


com.jrockit.mc.flightrecorder.ui com.jrockit.mc.memleak.ui 


v 
com. jrockit.me.rjmx.ui 


com.jrockit.mc.core “ 


v 
com.jrockit.mc.rjmx.core | 





POJO 


com.jrockit.mc.flightrecorder | 
v 


com.jrockit.mc.rjmx —————> com. jrockit.mc.common com.jrockit.mc.memleak.api 





v 
com.jrockit.mc.rcp 
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本 章 后 面 的 内 容 会 主要 介绍 如 何 启动 和 使 用 Rockit Mission Control, 以 及 如 何 处 理 可 能 会 遇 
到 的 问题 ， 有 关 其 内 部 组 件 的 内 容 会 在 后 续 章 节 中 介绍 。 








6.2.3 ”术语 介绍 


为 了 更 好 地 介绍 JRockit Mission Control, 这 里 需要 先 解释 一 些 相关 名 词 的 概念 , 名 词 的 上 下 
文 适 用 于 单独 使 用 了 下 ockit Mission Control, BKK A Eclipse 中 使 用 的 场景 。 


| 在 这 里 ，Eclipse 和 Eclipse 工作 台 (Eclipse workbench) 表示 相同 的 意思 。 | 





在 Eclipse RCP 应 用 程序 中 ， 称 主 窗口 为 “工作 台 ”， 在 工作 台中 有 两 类 窗口 ， 分 别 是 视图 
(view ) 和 编辑 器 (editor )。 编 辑 器 窗口 占据 了 工作 台 的 主要 部 分 ， 视 图 窗口 一 般 就 在 编辑 需 窒 
口 附近 。 

视图 常用 来 展示 已 选择 的 某 个 编辑 器 的 专 有 内 容 , 可 以 在 其 中 操作 编辑 器 的 内 容 , 或 载 人 新 
的 编辑 器 。 拖 动 视 图 ， 可 以 将 多 个 视图 窗口 停靠 在 一 起 。 

在 Eclipse 中 , 将 显示 视图 和 视图 位 置 的 配置 信息 统称 为 透视 图 (perspective )。 如 果 不 小 心 关 
闭 了 某 个 视图 , 或 对 调整 后 的 视图 位 置 不 太 满 意 的 话 , 可 以 通过 菜单 Window | Reset Perspective 
来 重 置 当前 透视 图 下 的 视图 窗口 。 

从 Eclipse 的 角度 说 ，JRockit 的 各 种 工具 就 是 编辑 器 ， 使 用 的 时 候 都 会 在 编辑 器 区 域内 打开 。 有 
时 会 同时 打开 多 个 编辑 器 ， 以 多 标签 的 形式 停靠 在 编辑 器 区 域 ， 用 户 可 以 拖 动 各 编辑 器 使 其 按 用 户 
的 意愿 排列 。 视 图 ( 例如 JVM 浏览 絮 ) 则 不 能 停靠 在 编辑 器 区 域 中 ， 而 只 能 位 于 编辑 器 区 域 的 周围 。 

在 Management Console 的 左 侧 ， 是 一 个 标签 组 工具 条 (tab group toolbar )， 可 以 选择 要 在 标 
签 页 容器 中 显示 哪些 内 容 。 其 他 TRockit Mission Control 工具 中 同样 存在 对 应 的 标签 组 工具 条 可 
供 选 择 。 在 JRockit Mission Control 3.1 版 本 中 ， 打 开 ManagementConsole 工具 会 默认 选择 一 般 信 
息 (general) 标签 组 ， 只 包含 概览 (overview) 一 个 标签 页 。 
















































































6.2.4 独立 运行 JRockit Mission Control 


JRockit Mission Control 既 可 以 单独 运行 ， 也 可 以 作为 插件 运行 在 Eclipse IDE 中 ， 随 JRockit 
JDK 一 起 发 行 的 JRockit Mission Control 是 单独 运行 的 。 

单独 运行 JRockit Mission Control 非常 简单 , 在 JRockit 发 行 版 的 bin 目录 下 直接 运行 命令 jrmc 
(在 Windows 系统 中 是 jrmc.exe ) 即 可 。 























单独 运行 Rockit Mission Control 的 话 ， 执 行 jrmc 命令 就 好 了 ， 不 要 出 “ 奇 

过 人 招 ”。 有 时， 客户 会 自行 设置 类 路 径 ， 直接 从 jar 文件 中 启动 JRockit Mission Control. 

> 建议 不 要 这 样 做 , AA jrme 的 启动 器 会 校 验 JRockit Mission Control 的 版 本 和 设 
置 的 类 路 径 ， 设 置 不 当 的 话 ， 会 无 法 启动 JRockit Mission Control. 
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启动 JRockit Mission Control 的 命令 如 下 所 示 : 

JROCKIT HOME/bin/jrmc 

在 Windows 系统 中 ， 安 装 了 JRockit Mission Control 之 后 ， 也 可 以 从 开始 菜单 中 启动 。 

启动 JRockit Mission Control 之 后 ， 会 显示 一 个 空 的 工作 空间 (参见 JRockit Mission Control 3.x 
版 本 ) 或 是 欢迎 界面 (参见 JRockit Mission Control 4.0 版 本 )。 如 果 安 装 正确 的 话 ，JRockit Mission 
Control 会 自动 检测 到 正在 本 机 中 运行 的 JVM ,即使 当前 没有 其 他 Java 应 用 程序 正在 运行 ,在 JRockit 
Mission Control 的 JVM 浏览 器 视图 中 也 会 列 出 运行 当前 JRockit Mission Control 的 JRockit JVM. 

在 JVM 浏览 器 视图 中 ， 可 以 针对 已 选 定 的 JVM 启动 不 同 的 Rockit Mission Control 工具 。 














由 于 大 多 数 工具 都 依赖 于 JRockit JVM 独 有 的 API, 它们 都 只 适用 于 JRockit 
JVM. 目前 只 有 Management Console 不 受 此 限制 ， 它 可 以 通过 JMX 技术 与 其 他 
JVM 通信 。 但 如 果 连 接 的 不 是 JRockit JVM 的 话 ， 就 无 法 使 用 某 些 功能 


查找 并 监控 本 地 JVM 非常 简单 ， 无 须 额 外 配置 ， 但 是 把 Rockit Mission Control 客户 端 和 应 

用 程序 放 在 同一 个 服务 器 上 运行 其 实 并 不 好 , JRockit Mission Control 客户 端 不 得 不 和 应 用 程序 争 

抢 操 作 系统 资源 。 当 然 ， 在 开发 和 测试 环境 中 ， 这么 做 没 问题 。 此 外 ,设置 信息 是 基于 每 个 连接 

的 ， 例 如 在 JRockit Management Console 的 图 形 展示 中 添加 一 个 属性 ， 换 一 个 连接 后 就 不 起 作用 

了 。 而 对 于 本 地 连接 来 说 ， 这 些 设置 则 根本 不 会 存储 下 来 。 

添加 一 个 用 户 自 定义 的 连接 非常 简单 ， 右 键 点 击 Connectors， 选 择 Create Connection. 
在 其 中 填写 相应 的 连接 信息 , 通常 情况 下 , 只 填写 主机 地 址 和 接口 即 可 。 其 他 相关 信息 如 下 。 

口 若 目 标 JVM 运行 在 JRockit JDK 1.4 版 本 上 ， 选 中 JDK 1.4 单 选 框 。 

O 选择 Custom JMX serviceURL 单 选 框 后 可 以 自行 输入 完整 JMX 服务 URL。JMX 服务 
URL 指定 了 如 何 连接 到 JMX 代理 ， 当 需要 通过 其 他 协议 ( 默认 使 用 基于 RMI W JMX Hp 
议 ) 连接 到 JMX 代理 时 ， 自 定义 JMX 服务 URL 是 很 有 用 的 。 

口 “Ji Store password in settings file (encrypted) 就 可 以 将 连接 密码 保存 下 来 。 如果 启用 了 
密码 保存 功能 , 则 会 使 用 主 密码 进行 加 解密 操作 。 点 击 菜单 窗口 | Preferences, ii; Reset 
Master Password 按钮 可 以 重新 设置 主 密码 。 

口 在 关闭 新 建 连接 按钮 之 前 ， 点 击 Test connection 按钮 ， 可 以 测试 之 前 配置 的 JMX 连接 
信息 


sv oO 







































































6.2.5 在 Eclipse 中 运行 JRockit Mission Control 


JRockit Mission Control 也 可 以 运行 在 Eclipse 中 , 不仅 不 会 有 功能 损失 ,而 且 还 有 很 多 好 人 处。 
如 果 应 用 程序 的 代码 正好 是 使 用 Eclipse 开发 的 ， 就 可 以 通过 JRockit Mission Control 客户 端 直接 
跳 转 到 指定 的 类 或 方法 中 。 

如 果 读 者 对 Eclipse 不 太 熟 ,或 者 不 打算 将 其 用 于 Java 开发 ,那么 就 可 以 直接 跳 过 本 节 内 容 了 。 
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若 想 在 Eclipse 中 运行 JRockit Mission Control， 就 需要 先 安 装 相 应 的 插件 。 最 新 版 的 插件 可 
以 在 Oracle Technology Network o 

FIER EA ZETEMA, REDER, W T AEETI AFF JRockit Mission Control 
插件 的 特点 ， 最 好 能 够 以 JRockit JVM 来 运行 ~ 虽说 不 使 用 JRockit JVM 也 能 使 用 大 部 分 
功能 ， 但 是 就 无 法 再 运用 某 些 特性 ( 例如 自动 发 现 本 地 JVM ) 和 Management Console 中 的 一 些 
JRockit 专 有 功能 了 。 

在 Eclipse 中 运行 JRockit 还 有 一 些 其 他 好 处 ,使 用 JRockit Real Time 工具 可 以 更 好 地 解决 交 
互 式 应 用 程序 中 的 响应 延迟 问题 。 

Eclipse 的 配置 文件 eclipse.ini 位 于 其 安装 目录 下 ， 可 以 通过 修改 其 命令 行 参数 来 启用 
JRockit JVM。 本 书 所 使 用 的 配置 文件 如 下 所 示 。 


-showsplash 

org.eclipse.platform 

-framework 
plugins\org.eclipse.osgi_3.4.3.R34x_v20081215-1030.jar 
-vm 
d:\jrockits\R27.6.3_R27.6.3-16_1.5.0\bin 
-vmargs 

-Xms512m 

-Xmx512m 

-XgcPrio:deterministic 

-XpauseTarget:20 


上 面 的 配置 文件 适用 于 Eclipse 3.4 和 JRockit R27， 如 果 要 使 用 R28 版 本 ， 只 需要 在 -vm B 
数 后 指定 JRockit R28 JVM 的 路 径 即 可 ，-vmargs 后 的 参数 无 须 修改 。 












































\\ 





从 R27 版 本 到 R28 版 本 ， 有 很 多 命令 行 参数 发 生 了 变化 ， 在 使 用 这 些 参数 
3 之 前 ， 请 先 查 阅 相关 文档 。 





安装 了 JRockit Mission Control 插件 后 ， 就 启动 JRockit Mission Control 了 ， 启 动 之 后 会 打开 
Mission Control 透视 图 。 在 Eclipse 3.x 版 本 中 ， 有 两 个 透视 图 可 用 ， 分别 是 Mission Control 的 
主 透视 图 和 Mission Control Latency 透视 图 , 后 者 用 于 分 析 JRA 记录 的 延迟 数据 。 到 Eclipse 4.0 
版 本 时 ， 所 有 的 工具 就 都 已 经 集成 到 一 个 透视 图 中 了 。 

打开 Mission Control 透视 图 后 ， 其 界面 内 容 与 单独 运行 JRockit Mission Control 类 似 。 正 如 
前 面 提 到 的 ， 在 Eclipse 中 运行 JRockit Mission Control 更 便于 与 应 用 程序 的 源 代 码 关联 起 来 。 

















6.2.6 ”远程 管理 JRockit 


若 要 启用 JRockit JVM 的 远程 管理 功能 ， 就 需要 在 启动 JVM 时 ， 局 动 外 部 管理 代理 ， 
通过 命令 行 参数 -Xmanagement 或 IRCMD 完成 。 有 关 JRCMD 的 内 容 会 在 第 11 章 详细 介 

下 面 的 代码 展示 了 如 何 通过 命令 行 参数 来 启用 远程 管理 功能 ,其 中 , 配置 的 远程 管 ae 
4712 ， 并 关闭 了 对 安全 认证 和 SSL 的 支持 。 
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JROCKIT_HOME/bin/java 
-Xmanagement :ssl=false, authenticate=false,port=4712 -cp . HelloJRMC 


现在 ,暂时 先 忽 略 与 安全 相关 的 参数 ,着重 谈 谈 端 口 。 在 本 章 后 续 的 小 节 中 会 介绍 安全 方面 
的 内 容 。 

之 前 曾经 提 到 过 , 默认 的 管理 代理 通过 基于 RMI 协 议 的 JMX 来 完成 。 由 于 RMI 通 常 使 用 匿 
名 端口 通信 ， 所 以 当 通 信 双 方 之 间 存 在 防火 墙 时 ， 就 会 带 来 些 麻烦 。 针 对 RMI 的 详细 内 容 超 出 
了 本 书 范围 ， 不 再 歼 述 。 这 里 谈 一 谈 在 R28 版 本 之 前 是 如 何 解 决 这 个 问题 的 。 
口 使 用 命令 行 参 数 -xmanagement :port=<port> 会 在 指定 端口 上 ( 默认 为 7091) 打开 一 
个 只 读 的 RMI Registry。 
口 打开 的 RMI Registry 中 只 包含 一 项 内 容 jmxrmi ， 它 是 用 于 与 RMI Server 通信 的 存根 代 
码 (stub )。 
口 RMI Server 使 用 一 个 不 会 被 覆盖 掉 的 匿名 端口 通信 。 

到 了 R28 版 本 ， 事 情 方 便 了 许多 。 默 认 情 况 下 ，RMIRegistry 和 RMI Server 端口 是 相同 的 ， 
使 防火 墙 的 配置 更 加 简单 。 

JRockit Discovery Protocol 

JRockit JVM 中 自 带 了 一 个 网 络 自动 发 现 的 特性 ， 称 为 JRockit 自动 发 现 协 议 ( JRockit 
discovery protocol, JDP )。JDP 服务 器 会 向 网 络 中 广播 JRockit 实例 的 存在 ， 这 个 特性 使 JRockit 
Mission Control 可 以 自动 发 现 远 程 JRockit JVM 的 存在 。 下 面 的 命令 在 启动 JRockit JVM 时 就 启 
用 了 IDP 协议 。 

JROCKIT HOME/bin/java 


-Xmanagement :ssl=false,authenticate=false,port=4712, 
autodiscovery=true -cp . HelloJRMC 


下 表 中 列 出 了 在 JRockit R28 版 本 中 可 用 于 控制 IDP 服务 器 的 系统 属性 ， 通 过 命令 行 启动 
JRockit JVM 时 ， 使 用 参数 -D 来 指定 相关 属性 即 可 。 例 如 : 


-Dcom.oracle.management .autodiscovery.period=2500 




























































































































































































属性 系统 说 ORR 
com.oracle.management.autodiscovery.period 广播 间隔 时 间 ， 单 位 毫秒 ， 默 认 值 为 5000 
com.oracle.management.autodiscovery.ttl 广播 数据 包 的 存活 期 限 ， 默 认 值 为 1 次 跳跃 
com.oracle.management.autodiscovery.address 用 于 自动 发 现 的 广播 地 址 ， 默 认 值 为 232.192.1.212 
com.oracle.management.autodiscovery.targetport 用 于 广播 自动 发 现 信息 的 端口 ， 默 认 值 为 7095 
com.oracle.management.autodiscovery.name 等 级 名 称 ， 参 加 下 面 的 示例 














当 JDP 服 务 器 向 网 络 中 广播 了 JRockit JVM 的 位 置 后 ， 在 Rockit Mission Control 客户 端的 
JVM 浏览 器 视图 中 ， 有 以 下 3 种 方法 使 用 等 级 名 称 。 
口 简单 名 称 
m 示例 : -Djrockitmanagementserver discovery.name=MyJVM。 


m 显示 : 在 JVM 浏 览 需 视 图 中 出 现 的 连接 名 称 为 MyJVM。 
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O 完整 路 径 

= 示例 : -Djrockit.managementserver.discovery.name=/MyJVMs/MyJVM。 

m 显示 : 在 JVM 浏览 器 视图 中 会 有 一 个 名 为 MyJVMs 的 文件 夹 ， 其 中 有 一 个 名 为 MyJVM 
的 虚拟 机 连接 。 
口 以 分 隔 符 结尾 的 路 径 

m 示例 : -Djrockit.managementserver.discovery.name=/MyJVMs/。 

mw 显示 : 在 JVM 浏览 器 视图 中 会 有 一 个 名 为 MyJVMs 的 文件 夹 , 在 其 中 会 通过 反 向 DNS 

查找 列 出 JDP 数据 包 所 指明 的 主机 。 





AT RE 示 
JDP 服务 器 会 人 ey com.oracle.management .autodiscovery. 
property TAN 系统 属性 ， 并 将 其 发 送 给 客户 端 。 从 R28.0.0 744, BP ae 
须 再 使 用 这 些 属性 ， 而 是 将 之 放 在 JRockit Mission Control 客户 端的 
IConnectionDescriptor 接口 中 供 开 发 者 使 用 。 














下 表 是 R28 版 本 中 可 用 于 命令 行 参数 -xmanagement 中 的 属性 。 








& 数 说 明 默 认 值 
port = <int> RMI Registry 所 使 用 的 端口 7091 
ssl = [truelfalse] 启用 SSL, TERS, 这 只 是 启用 了 服务 器 端的 SSL， 如 果 想 在 客 ”true 














户 端 也 启用 SSL， 则 需要 设置 属性 com. sun.management. 
jmxremote.ssl.need.client. auth=true。 此 外 ， 默 认 情 
ULF, RMI Registry 并 不 会 启用 SSL， 需 要 手动 启用 ， 人 参见 
registry.ssl 属性 的 说 明 



































registry.ssl = 将 RMI 连接 器 绑 定 到 启用 了 SSL 的 RMI Registry false 
true| false] 

he aes s 使 用 JMX 时 ， 是 否 启用 密码 验证 。 如 果 关 闭 ， 则 任何 人 都 可 true 
| 访问 所 有 资源 

autodiscovery = 为 远程 JMX 连接 器 启用 自动 发 现 服务 。 启 用 自动 发 现 服务 可 false 





























true| false] 











以 让 同一 子 网 其 他 机 器 自动 发 现 启用 了 远程 管理 的 JVM。 注 
T, RAMAH TEE JMX 管理 后 ， 自 动 发 现 服务 才 会 生效 
ocal = [truelfalse] 是否 启 用 本 地 管理 代理 true 


rmiserver.port=<int> 设置 RMI Server 的 端口 ， 默 认 情 况 下 与 RMI Registry 相同 。 与 RMI Registry 端口 相同 
但 如 果 RMI Server Ja FHS SSL, 而 Registry 没有 , 则 使 用 任意 












































空闲 端口 
remote= [truelfalse] 是 否 启 用 远程 管理 代理 false 
config.file =<path> 指定 配置 文件 的 地 址 JRE_HOME/1ib/management 
/management. properties 
JRockit R28 版 本 中 还 包含 了 一 些 可 用 于 控制 具体 配置 的 系统 属性 ， 如 表 所 示 。 
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2 x 说 明 默 UW 值 

CO Rr ol oon es 通过 JMX 连接 器 启用 JMX 本 机 监控 。 该 连接 器 发 布 在 ”true 
aa AEE SRA 一 个 私有 接口 上 ，JMX 客户 端 可 通过 Attach API 来 使 用 

该 接口 (参见 官方 文档 对 com.sun.tools.attach 的 

说 明 )。 车 该 客户 端 和 JMX 代理 是 由 同一 用 户 启动 的 ， 

则 客户 端 可 以 直接 使 用 其 提供 的 连接 器 ， 而 无 须 安全 

校 验 。 如 果 将 该 属性 值 置 为 false， 则 即使 指定 了 

jmxremote.port 的 值 ， 也 不 会 启动 本 地 连接 器 
com.oracle.management .jmxre- 与 -Xmanagement :port=<int> 配 置 相 同 7091 
mote.port = <int> 
com.oracle.management . jmxre- 与 -Xmanagement :rmiserver.port=<int> 配 置 相同 7091 
mote.rmiserver.port = <int> 
com.oracle.management .jmxre- 与 -Xmanagement :ssl=[true|false] 配 置 相同 true 
mote.ssl = [true] false] 
com.oracle.management.jmxre- 与 -Xmanagement:registry.ssl= [truelfalse] 配 false 
mote.registry.ssl = 
[truelfalse] 置 相同 
com.oracle.management .jmxre- ”所 要 使 用 的 SSL/TSL 协议 的 版 本 列表 ， 以 逗号 分 隔 默认 的 SSL/TSL 协 议 版 本 
mote.ssl.enabled.protocols = 
<values> 
com.sun.management .jmxremote 所 要 使 用 的 SSL/TSL 协议 的 密码 组 ， 以 逗号 分 隔 默认 的 SSL/TSL 密码 组 
.ssl.enabled.cipher.suites = 
<values> 
com.oracle.management . jmxre- 配置 是 否 启用 SSL false 


mote.ssl. need.client.auth = 
[true| false] 


com.oracle.management.jmxre- $j xmanagement:authenticate= [truelfalse] 配 true 
mote.authenticate = 置 相同 
[true| false] Hla 








com.oracle.management .jmxre- ”指定 连接 所 使 用 的 密码 文件 。 如 果 属 性 com.sun, JRE_HOME/1ib/mana- 
mote.password.file = <path> gement /jmxremote. 


management .jmxremote.authenticate 的 值 为 password 


false， 则 会 忽略 该 属性 的 值 ， 访 问 的 时 候 也 不 会 做 密 
码 校 验 。 和 否则， 就 肯定 会 用 到 该 属性 之 所 指向 的 文件 。 
若 文件 内 容 为 空 ， 则 禁止 访问 
com.oracle.management .jmxre- ”指定 连接 所 使 用 的 访问 文件 。 如 果 属 性 com. sun.  JRE_HOME/1ib/mana- 


mote.access.file = <path> 3 Bas gement /jmxremote. 
management .jmxremote.authenticate 的 值 为 accesg 


false， 则 会 忽略 该 属性 的 值 ， 访 问 的 时 候 也 不 会 对 访 

问 做 限制 。 否则 ,就 肯定 会 用 到 该 属性 之 所 指向 的 文件 。 
车 文件 内 容 为 室 ， 则 禁止 访问 

com.oracle.management .jmxre- ”指定 JMX 代理 校 验 用 户 身份 时 所 使 用 的 JAAS 配置 。 ”默认 使 用 基于 文件 的 密 

more. ogin.config = <config 当 使 用 该 属性 黎 善 默认 的 登录 配置 时 ， 指 定 的 配置 必须 。 码 校 验 

存在 于 JAAS 所 加 载 的 文件 中 。 此 外 ， 配 置 中 所 指定 的 

登录 模块 名 应 该 使 用 用 户 名 和 密码 来 验证 用 户 身份 。 更 


多 信息 请 参考 javax. security.auth.callback. 
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NameCallback 和 javax. security.auth.callback. 
PasswordCallback 的 说 明文 档 

















com.oracle.management . jmxre- 4j -xmanagement:config.file=<file name> 配 置 JRE_HOME/1ib/manag 

mote.config.file — ement /management. 
相同 properties 

com.oracle.management.snmp. 在 指定 端口 上 启用 内 置 的 SNMP 代理 无 默认 值 


port = <int> 





6.2 ”概述 159 















































(2) 
2 x 说 PA a UW 值 
com,.oracle.management . snmp. 指定 内 置 的 SNMP 代理 要 向 哪个 的 端口 发 送信 号 162 
trap = <int> 
com.oracle.management.snmp. 为 内 置 的 SNMP 代理 启用 Access Control Lists (ACL) true 
acl = [true] false] 
com.oracle.management . snmp. 指定 ACL 文件 。 若 在 启动 代理 后 再 修改 ACL 文件 , 则 JRE_HOME/lib/mana- 
acl.file = <path> 只 会 在 下 一 次 启动 代理 时 才 会 生效 gement/snmp.acl 
See ee 指定 本 地 主机 的 网 络 地 址 ,用 于 强制 内 置 的 SNMP 代理 ”无 默认 值 
ys eae ane ee 绑 定 到 指定 的 网 络 地 址 上 ， 当 主机 具有 多 个 网 络 地 址 ， 
而 用 户 只 想 监 听 其 中 一 个 时 ， 可 以 使 用 该 参数 加 以 控制 
com.oracle.management .autod- 与 -Xmanagement :autodiscovery=true 配置 相同 false 
iscovery = [truel|false] 


6.2.7 ”安全 限制 


要 想 在 安全 环境 下 使 用 JRockit Mission Control, 首 包 要 对 网 络 做 相关 配置 ， 保证 只 有 某 些 主 
机 可 以 连接 到 管理 代理 。 具体 对 防火 墙 和 路 由 器 的 配置 超出 了 本 书 范 畴 ， 这 里 不 再 歼 述 。 

















在 JRockit R28 之 前 : oe 中 , 使 用 防火 墙 来 限制 对 管理 代理 的 访问 很 复杂 ， 
因为 与 RMI Server 的 通信 是 在 匿名 端口 上 进行 的 ， 与 RMI Registry 建立 连接 后 ， 
就 没 办 法 再 对 RMI Server IRENA 的 端口 施加 影响 了 。 在 R28 版 本 中 ， 默认 情况 
F, RMI Registry 和 RMI Server 使 用 相同 的 端口 ， 简 化 了 防火 墙 的 配置 。 


为 了 安全 起 见 ， 管 理 代理 应 该 启用 SSL 加 密 ， 而 且 应 该 在 RMI Server 和 RMI Registry 两 端 
都 启用 SSL。 默 认 情 况 下 ， 服 务 器 端的 SSL 校 验 是 开启 的 ， 而 客户 端 默 认 没 有 开启 。 
在 下 面 的 示例 中 ， 服 务 器 端 和 Registry 端 都 启用 了 SSL， 同 时 开启 了 对 客户 端的 校 验 : 


JROCKIT_HOME\bin\java -Xmanagement:ssl=true,registry.ssl=true,port=4711 
-Dcom.oracle.management .jmxremote.ssl.need.client.auth=true MyApp 


要 想 启 用 SSL， 就 需要 先 设置 证 书信 息 。 在 大 部 分 Java 环境 中 ， 都 使 用 keystore 来 存储 私 
钥 ， 并 在 truststore 中 存储 受信 证 书 。 











| 未 和 更 多 有 关 keystore 的 信息 ， 请 参阅 J2SE SDK 文档 ， 特 别 是 JSSE 小 节 的 相 
关内 容 








接 下 来 ， 需 要 配置 认证 信息 和 角色 ， 只 有 经 过 认证 的 实体 才 可 以 访问 特定 的 功能 。 访 问 权 限 
由 jmxremote.password 和 jmxremote.access 两 个 文件 控制 ， 它 们 均 位 于 JROCKIT_HOME/jre/lib/ 
management/ 目 录 下 , jmxremote.password 文件 中 保存 了 不 同 角 色 所 使 用 的 密码 , jmxremote.access 
文件 中 保存 了 每 个 角色 的 访问 权限 。 每 个 角色 必须 在 两 个 文件 中 都 有 一 个 条 目 才 能 工作 。 
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为 了 便于 配置 , 在 JRockit JRE 中 自 带 了 一 个 jmxremote.password 模板 文件 , 复制 文件 TROCKIT_ 
HOMF/jre/lib/management/jmxremote.password.template 为 JROCKIT_HOME/jre/lib/management/ 
jmxremote.password 即 可 使 用 。 





所 有 的 JRockit MissionControl 工具 都 依赖 于 JMXMAPI, 而 用 户 必 须要 有 创 
一 建 TRockitConsole 这 个 MBean 的 权限 才能 够 初始 化 JMXMAPI。 


在 下 面 的 示例 中 ,为 角色 controlRole 授予 了 创建 JRockitconsole 这 个 MBean 的 权限 : 


controlRole readwrite \ 
create oracle.jrockit .management .JRockitConsole 


JRockitConsole 这 个 MBean 会 初始 化 IMXMAPI. 

在 多 用 户 环境 中 ， 即 多 个 不 同 的 用 户 可 能 会 使 用 同一 套 Java 工具 集 ， 则 需要 将 jmxremote. 
password 文件 复制 到 用 户 的 主 目录 下 ， 并 设置 系 统 属 性 com. sun . management .jmxremote. 
password.file 来 指定 文件 的 具体 位 置 。 

由 于 jmxremote.password 中 存储 的 是 未 加 密 的 密码 , 需要 依赖 当前 操作 的 权限 控制 保证 该 文 
件 的 安全 性 。 如 果 密 码 文 件 权 限 控制 出 现 错误 ， 则 必须 采取 措施 保证 执行 Java 应 用 程序 的 用 户 
对 密码 文件 只 有 读 取 权限 。 在 类 UNIX 系统 上 ， 可 以 通过 命令 chmod 600 $password file Æ 
实现 ， 而 在 Windows 系统 中 ， 控 制 权限 就 稍微 复杂 一 些 了 。 


| 有 关 在 Windows 系统 中 配置 文件 访问 权限 的 内 容 请 参见 Java 1.5.0 的 
~ 相关 









































文档 。 





其 实 ， 不 必 在 防火 墙 上 额外 打开 一 个 端口 ， 所 有 的 通信 都 可 以 经 由 加 密 的 SSH 隧道 进行 。 访 
问 SSH 隧道 通常 会 使 用 localhost 上 的 已 有 端口 。 当 与 JMX 代理 建立 连接 时 , 会 发 送 相关 存根 信息 ， 
其 中 通常 会 包含 目标 计算 机 的 地 址 。 通 过 修改 hosts 文件 或 java. rmi .server .hostname 系统 属 
PE, 可 以 使 用 回环 地 址 或 localhost 替换 掉 存 根 信息 中 的 目标 计算 机 地 址 。 不 过 , 这 两 种 方法 都 有 风 
险 ， 使 用 时 需要 小 心 ， 因 为 它们 会 对 运行 在 同一 操作 系统 或 JVM 之 上 的 其 他 应 用 程序 产生 影响 。 


6.2.8 ”处 理 连接 问题 


如 果 无 法 自动 发 现 本 地 的 JRockit JVM， 可 以 从 以 下 几 方 面 着 手 检查 。 

O 如 果 是 运行 在 Windows 系统 上 ， 检 查 系统 临时 目录 是 否 支 持 文 件 权 限 控制 (例如 NTFS 
是 支持 的 )。 这 是 必要 的 ， 因 为 本 地 连接 需要 依据 文件 访问 权限 创建 所 需 临 时 文件 ， 而 在 
FAT 这 类 文件 系统 上 ， 是 无 法 进行 的 。 

O 连接 目标 是 否 运行 在 JRockit JVM E? JRockit Mission Control 客户 端 是 否 运 行 在 JRockit 

JVM 上 ? 

口 连接 目标 和 JRockit Mission Control 客户 端 使 用 的 是 否 都 是 JDK 1.5 及 以 上 的 版 本 ? 
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口 是 否 是 以 当前 用 户 运行 的 连接 目标 ? 


若 目 标 JVM 使 用 的 是 JDK1.4 版 本 , 则 需要 在 JRockit Mission Control 的 JVM 

浏览 器 视图 中 手动 新 建 一 个 连接 ,然后 在 目标 JRockitJVM 上 显 式 开启 管理 代理 。 

过 人 这 是 因为 在 JDK 1.4 版 本 中 还 没有 出 现 MBean 服务 器 的 概念 ， 而 JRockit 1.4 版 
> 本 中 实现 了 一 个 私有 的 管理 协议 ， 称 为 RMP， 在 客户 端 会 被 转换 为 JMX。 若 想 
启动 代理 ， 可 以 通过 添加 命令 行 参数 ， 或 使 用 JRCMD 工具 实现 (参见 第 11 章 


的 介绍 )。 


如 果 无 法 连接 到 外 部 的 管理 代理 ( 例如 运行 在 远程 机 器 上 的 管理 代理 )， 可 以 从 以 下 几 方 面 





入 手 检查 。 















































口 防火 墙 是 否 配置 正确 ? 









































O 连接 配置 是 否 正确 ? 在 连接 面板 中 有 一 个 按钮 可 用 于 测试 相关 选项 是 否 配置 正确 。 如 果 
目标 JVM 使 用 的 JDK 1.4， 则 应 该 使 用 3.x 版 本 的 客户 端 来 连接 。 

O 客户 端 版 本 是 否 正确 ?最 简单 的 办 法 是 , 使 用 和 目标 JVM 相同 的 版 本 。 如 果 目 标 SVM 使 
用 的 JDK 1.4， 则 应 该 使 用 3.x 版 本 的 客户 端 。 

口 在 连接 面板 中 ，JDK 版 本 是 否 选择 正确 ? 





口 如 果 启 用 了 SSL 的 话 ， 客 户 端 和 服务 器 端的 SSL 配置 是 否 正确 ? 
口 如 果 启 用 了 身份 验证 的 话 ，jmxremote.access 文件 是 否 配 置 正确 ? 
口 KA HERLAH hosts 文件 是 否 配 置 





正确 。 


日 








在 处 理 远程 管理 代理 的 连接 问题 时 ,首先 确保 开启 了 SSL， 并 关闭 了 身份 校 验 ， 如 果 这 时 可 
以 正常 连接 ， 则 按照 6.2.7 节 中 介绍 的 内 容 检 查 一 下 校 验 信息 是 否 配 置 正确 。 

如 果 Management Console 提示 说 找 不 到 某 个 MBean， 例 如 Profiling MBean, 很 可 能 是 由 于 
jmxremote.access 文件 配置 错误 导致 的 。 为 了 初始 化 JMXMAPI， 用 户 必 须 具 有 创建 JRockitConsole 
这 个 MBean 的 权限 ， 参 见 6.2.7 节 中 的 介绍 。 





























主机 名 解析 问题 
































有 时 候 ， 无 法 连接 到 远程 JVM 可 能 是 因为 解析 主机 名 时 发 生 了 错误 ， 这 时 系统 给 出 的 错误 





信息 可 能 是 下 面 这 个 样子 : 


Could not open Management Console for sthx6454:7094. 
java.rmi.ConnectException: Connection refused to host: 


127.0.0.1; nested exception is: 


Connection refused: connect 


java.net .ConnectException: 


at sun.rmi.transport.tcp.TCPEndpoint .newSocket (TCPEndpoint.java:574) 
at sun.rmi.transport.tcp.TCPChannel.createConnection 


(TCPChannel.java:185) 


at sun.rmi.transport.tcp.TCPChannel.newConnection (TCPChannel.java:171) 
at sun.rmi.server.UnicastRef.invoke(UnicastRef.java:94) 
at javax.management.remote.rmi.RMIServerImpl_Stub.newClient 


(Unknown Source) 


at javax.management.remote.rmi.RMIConnector.getConnection 
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(RMIConnector.java:2239) 

at javax.management.remote.rmi.RMIConnector.connect 
(RMIConnector.java:271) 

at javax.management.remote.rmi.RMIConnector.connect 
(RMIConnector.java:229) 

at com.jrockit.console.rjmx.RJMXConnection.setupServer 
(RJMXConnection. java:504) 


RMI Registry 通过 暴露 出 依赖 于 主机 名 的 存根 信息 来 建立 与 RMI Server 的 连接 。 在 之 前 的 示 
例 中 ,成 功 地 连接 到 RMI Registry， 获 取 到 连接 RMI Server 的 存根 。 创 建 存根 的 默认 行为 是 使 用 
InetAddress.getLocalHost () .getHostAddress () 方 法 找 出 所 使 用 的 主机 名 ， 不 过 当主 机 
使 用 了 多 个 网 卡 接口 或 配置 错误 时 ， 就 无 法 正确 解析 出 主机 名 了 。 在 之 前 的 示例 中 , 存根 中 信息 
指明 要 连接 到 localhost， 而 不 是 sthx6454。 

最 常见 的 连接 问题 是 hosts 文件 (在 Linux 系统 上 ， 是 /etc/hosts， 在 Windows 系统 上 ， 是 
%SYSTEMROOT%\system32\drivers\etc\hosts ) 配置 错误 ,在 Linux 系统 上 ， 可 以 通过 hostname -i 
命令 查看 主机 名 的 解析 地 址 。 

除了 配置 hosts 文件 外 ， 还 可 以 在 服务 器 端 设 置 java .rmi .server .hostname 系统 属性 来 
指定 客户 端 连接 时 使 用 的 主机 名 。 注 意 ,设置 该 属性 会 影响 到 同一 台 机 器 上 正在 运行 的 其 他 JVM。 

另 一 个 解决 办 法 是 使 用 SSH 隧道 ， 该 方法 只 在 JRockit R28 版 本 中 有 效 ， 因 为 在 这 个 版 本 中 
可 以 显 式 指定 RMI Server 的 端口 。 
















































































6.3 更 新 点 


从 JRockit Mission Control 3.1 版 本 起 ， 增 加 了 一 个 Mission Control 插件 更 新 点 。 

JRockit 和 J2SE 发 行 版 中 都 包含 了 一 个 名 为 JConsole 的 JMX 控制 台 工具 。 针 对 3.1 版 本 的 更 
新 点 中 包含 了 一 个 可 以 在 JRockit Mission Control 中 运行 JConsole 的 插件 ， 此 外 还 带 有 一 个 名 为 
PDE ( plug-in development environment ) 的 插件 开发 环境 ， 以 便 对 JRockit Mission Control Console 
做 定制 化 开发 。 更 多 有 关 JRockit Mission Control 插件 开发 的 内 容 ， 请 参见 第 7 章 、 第 9 章 和 第 
10 章 的 内 容 。 

从 JRockit Mission Control 4.0 起 ，Oracle 计划 在 Mission Control 中 增加 更 多 的 插件 。 

















6.4 调试 JRockit Mission Control 


通过 命令 jrmc 启动 JRockit Mission Control 时 ， 附 加 参数 -aebug 可 以 以 调试 模式 启动 JRockit 
Mission Control， 这 样 可 以 在 运行 时 输出 更 多 信息 。 启 用 调试 模式 会 使 JRockit Mission Control 的 
各 子 系 统 的 行为 有 些许 改变 , 例如 控制 台 图 表 会 展示 演 染 信息 , 会 改变 日 志 等 级 , 记录 更 详细 的 
输出 内 容 。 

FETE Windows 系统 中 查看 发 送 给 控制 台 的 日 志 信 息 ， 需 要 将 标准 错误 (stderr) 重 定向 到 
其 他 地 方 , 这 是 因为 jrmc 是 由 加 载 器 javaw 加 载 的 , 默认 不 会 产生 控制 台 输 出 。 要 想 查 看 日 志 信 
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息 ， 可 以 使 用 类 似 如 下 的 命令 启动 JRockit Mission Control; 
\>%JROCKIT_HOME%\bin\jrmc -consoleLog -debug 2>&1 | more 


D: 
若 只 想 修 改 日 志 等 级 ,可 以 在 Preferences 菜单 中 选择 一 个 日 志 配 置 文件 。 日 志 配 置 文件 需 
要 符合 标准 的 java.utillogging 格式 。 在 修改 日 志 配 置 后 ， 需 要 重新 启动 JRockit Mission Control 
来 使 之 生效 。 
下 面 的 示例 展示 了 在 启用 调试 模式 时 的 配置 信息 : 


HEHE HE HE HE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HE HE FE HE FE HE HE HE HE FE HE HE HE HE HE HE FE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HE HE HE HH HE HHHH HE HHHH 
# JRockit Mission Control Logging Configuration File 

# 

# This file can be overridden by setting the path to another 
# settings file in the Mission Control preferences. 

HEHE HE HE HE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HE HE HE HE FE HE HE HE HE HE HE FE HE HE HE HE HE HE HE HE HE HE HH HE HHHH HE HHHH 





























HHHHHRHHHTERR RHEE EERE E EERE TE REAR EE ERE E EER EHE EERE EEE 
# Global properties 
HHHHHRHHHEERE RHEE REAPER RARE E REAR ERR RHEE RRR RHE EERE EEE 


"handlers" specifies a comma separated list of log Handler 
classes. These handlers will be installed during ApplicationPlugin 
startup. 

Note that these classes must be on the system classpath. 

handlers= java.util.logging.FileHandler, 
java.util.logging.ConsoleHandler 





+ tk +H H 


Default global logging level. 

This specifies which kinds of events are logged across 
all loggers. For any given facility this global level 
can be overridden by a facility specific level 

Note that the ConsoleHandler also has a separate level 
setting to limit messages printed to the console. 
-level= ALL 


so OH OH OH OH 


HEHE HE HEHE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HE HE FE HE FE HE HE HE HE FE HE HE HE HE HE HE FE HE HE HE HE HE HE FE HE HE HE HE HE HE HE HE HE HE HE HE HHHH HE HHHH 
# Handler specific properties. 
# Describes specific configuration info for Handlers. 


HEHEHE HE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HH FE HE HE HE HE HE HE HE HE HE E HE HE HE HE E H H E E H E EE H E EE HEHH 


# Default file output is in user's home directory. 
java.util.logging.FileHandler.pattern = %h/mc_%u.log 
java.util.logging.FileHandler.limit = 50000 
java.util.logging.FileHandler.count = 1 
java.util.logging.FileHandler.formatter = 
java.util.logging.SimpleFormatter 
java.util.logging.FileHandler.level = FINE 


java.util.logging.ConsoleHandler.formatter = 
java.util.logging.SimpleFormatter 
java.util.logging.ConsoleHandler.level = FINE 
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EHE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE FE HE HE HE HE HE HE FE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HH HH HE HH HE HHH 
Facility specific properties. 

Provides extra control for each logger. 

For example setting the warning level for logging from the 
JRockit Browser, add the following line: 

# com.jrockit.mc.browser.level = INFO 

HEHE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE HE FE FE HE HE HE HE HE HE HE HE HE HE HE E HE HE HE HE HH HE HE HHHH HHHH 
sun.rmi.level = INFO 

javax.management.level = INFO 


# 
# 
# 
# 


6.5 ”小结 


本 章 简单 介绍 了 JRockit Mission Control 套件 的 背景 和 其 各 个 子 系统 , 包括 Management Console, 
Memory Leak Detector 和 Flight Recorder， 此 外 还 介绍 了 JRockit JDK 的 一 个 命令 行 工 具 JRCMD。 

JRockit Mission Control 既 可 以 独立 运行 ， 也 可 以 作为 搬 件 运行 在 Eclipse IDE 中 。 本 章 介 绍 
了 如 何 通过 JRockit 管理 代理 来 管理 远程 JRockit JVM, 如 何 处 理 连接 问题 , 以 及 如 何 调 试 JRockit 
Mission Control。 

本 章 还 介绍 了 如 何 对 访问 服务 器 端的 Mission Control 组 件 增加 安全 限制 。 最 后 介绍 了 
Experimental Update Site， 从 中 可 以 获得 关于 Mission Control 的 额外 内 容 。 

接 下 来 的 几 章 会 介绍 JRockit Mission Control 套件 中 的 各 个 组 件 。 




















Management Console 

















最 先 集成 到 JRockit Mission Control 套件 中 的 工具 是 JRockit Management Console ， 它 可 以 用 
来 监控 JRockit JVM 以 及 运行 在 其 中 的 应 用 程序 ， 此 外 还 可 以 修改 JRockit JVM 中 某 些 参数 的 运 
行 时 状态 。 阅 读本 章 前 ， 请 先 了 解 JMX (Java management extension ) 的 相关 术语 。 

Management Console 基于 JMX 实现 ， 监 控 通 过 JMX 主动 暴露 出 管理 接口 的 应 用 程序 和 JRockit 
JVM. 

本 章 主 要 内 容 如 下 : 
口 如 何 启动 Management Console 
口 如 何 监控 和 展示 MBean 的 属性 
口 如 何 调用 MBean 的 操作 
口 如 何 创建 触发 规则 
口 如 何 启用 死 锁 检查 
口 如 何 分 析 线 程 内 存 分 配 情况 和 CPU 运行 情况 
口 诊断 命令 简介 


口 如 何 扩展 Management Console 
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7.1 JMX Management Console 





JRockit Management Console 的 诞生 时 间 要 早 于 JRockit Mission Control 套件 , 2 pk JMX 还 
要 早 。 


JRockit 最 初 几 个 版 本 的 定位 是 “可 以 运行 Java 的 虚拟 机 ”， 而 不 是 JVM。 

其 中 的 关键 区 别 在 于 ， 只 有 经 过 Sun 公司 (现在 是 Oracle 公司 ) 认证 的 、 遵 循 

Java 标准 的 虚拟 机 才 可 以 被 称 为 JVM。 进 一 步 来 说 ， 如 果 某 款 虚 拟 机 未 经 过 认 

证 ， 则 不 可 以 使 用 Java 商标 。 当 时 ， 若 想 获得 Sun 公司 的 认证 ， 就 必须 要 有 与 
众 不 同 的 “增值 点 ”。 我 们 最 初 的 想法 是 把 “ 超 强 性 能 ”作为 增值 点 。 不 过 ， 虽 
然 从 技术 上 讲 ，JRockit 确实 有 着 超 强 的 性 能 ， 但 是 这 算 不 上 真正 的 增值 点 。 于 

是 ， 我 们 改 为 以 JVM 的 在 线 管理 功能 作为 增值 点 ， 并 在 后 来 逐步 将 其 发 展 成 为 


JRockit Management Console。 
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Management Console 主要 用 于 监控 一 个 或 多 个 JRockit JVM 实例 ， 并 提供 详细 信息 。 由 于 每 
个 JVM 都 对 应 其 自己 的 Management Console 编辑 器 区 域 ， 实 际 运 行 时 很 少 会 同时 监控 多 个 
JRockit JVM 实例 。 为 了 能 够 长 时 间 同 时 监控 大 量 SVM 实例 ， 就 应 该 使 用 更 具 扩 展 性 的 分 布 式 解 
决 方案 , 例如 Oracle Enterprise Manager. 

Management Console 和 JRockit JVM 之 间 使 用 标准 JMX 进行 通信 ， 从 Java 5.0 开始 ， 某 些 通 
过 JMX 暴露 出 的 管理 特性 已 经 被 写 人 JSR-174。 























JSR-174 添 加 了 java.lang.management 包 和 与 平台 MBean 服 务 器 相关 的 
工具 类 ， 以 增强 JVM 的 管理 功能 。 更 多 有 关 平 台 MBean 服务 器 的 内 容 ， 请 参见 
JavaAPI 和 相关 文档 。 





在 JSR-174 发 布 之 后 ， 大 多 数 Java 应 用 程序 和 相关 框架 都 将 其 自 有 的 MBean 发 布 到 平台 
MBean 服务 器 中 ， 以 便 使 用 Management Console 进行 监控 和 管理 。 

由 于 JRockit 在 JSR-174 发 布 之 前 就 推出 了 Management Console, Management Console 还 可 
以 监控 JRockit 1.5 之 前 的 版 本 ， 从 表面 上 看 ， 使 用 的 都 是 JMX， 但 其 实在 实现 时 使 用 的 是 一 种 
私有 协议 。 

本 章 后 面 的 内 容 会 介绍 JRockit Mission Control Console 及 其 使 用 方法 。 为 了 便于 查询 ， 相 关 
内 容 的 编排 与 Management Console 中 标签 页 的 设置 是 相对 应 的 。 










































































7.2 Management Console 


启动 JRockit Management Console 非常 简单 ,只 需 在 JVM 浏览 器 中 ,选择 要 连接 的 目标 JVM, 
然后 在 工具 栏 中 点 击 Management Console 按钮 ， 或 者 在 右键 菜单 中 点 击 Start Console 即 可 。 

在 启动 Management Console 时 有 一 个 小 技巧 : 可 以 直接 将 建立 的 连接 拖 到 编辑 区 ， 默 认 情 
况 下 会 打开 与 目标 JVM 的 连接 。 第 6 章 曾 经 介绍 过 ，JRockit Mission Control 可 以 连接 到 远程 和 
本 地 的 JVM 实例 ， 区别 在 于 ,运行 在 本 地 的 JVM 实例 会 自动 被 发 现 ， 而 且 也 无 法 利用 上 述 技巧 
来 创建 连接 。 

更 多 有 关 不 同 连接 类 型 的 内 容 ， 请 参见 第 6 章 。 
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7.2.1 一 般 信息 标签 组 


Management Console 中 的 标签 页 按 功 能 划分 为 几 个 不 同 的 标签 组 , 垂直 排列 在 编辑 区 的 左 侧 
( 如 图 所 示 )， 其 中 第 一 个 标签 组 是 一 般 信息 ( genaral )。 
一 般 信息 标签 组 中 只 有 一 个 标签 : Overview。 在 编辑 区 底部 可 切换 显示 不 同 的 标签 页 。 


览 (overview) 
概览 标签 页 显示 了 JVM 和 系统 环境 中 的 一 些 关 键 信息 ， 该 标签 页 中 的 内 容 可 根据 实际 需要 
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做 定制 化 处 理 。 

JRockit Mission Control 把 标签 页 中 的 内 容 划 分 为 不 同 的 展示 区 。 概览 标签 页 顶部 的 展示 区 是 
画板 〈dashboard )， 其 中 的 每 个 面板 都 展示 了 所 监视 相关 特性 的 当前 值 和 峰值 ， 具 体 数值 显示 在 
对 应 的 面板 底部 。 每 个 面板 中 有 两 根 指针 ， 浅 色 的 指针 表示 所 达到 过 的 水 位 线 (watermark ), YR 
色 的 指针 表示 当前 的 数值 。 

在 Management Console 中 ， 大 部 分 展示 区 都 可 以 折 和 过 起 来 〈 点 击 展 示 区 左上 角 的 倒 三 角 图 
标 即 可 )， 以 便 留 出 更 大 的 空间 来 展示 其 他 数据 。 此 外 ， 展 示 区 还 包含 了 很 多 其 他 按钮 。 
访问 模式 开关 : 在 图 形 模式 和 文字 模式 之 间 切 换 。 
刷新 : 刷新 当前 展示 区 的 数据 。 
帮助 : 提供 针对 当前 展示 区 的 帮助 信息 。 
关闭 : 关闭 当前 展示 区 。 
添加 : 在 当前 展示 区 中 添加 数据 展示 组 件 ; 若是 在 面板 展示 区 中 点 击 添加 按钮 ， 则 会 新 
面板 。 
删除 : 从 当前 展示 区 中 删除 某 个 数据 展示 组 件 。 

国 表 设 置 打开 一 个 对 话 框 ， 以 配置 数据 表 的 展示 内 容 ; 大 部 分 数据 表 只 显示 了 一 部 分 内 
容 ， 可 以 通过 表 设 置 来 选择 要 展示 的 内 容 。 

当然 ， 在 修改 了 标签 页 中 的 展示 内 容 后 ， 还 可 以 通过 右上 和 角 的 重 置 按 钮 六 恢复 为 默认 配置 。 

用 户 可 以 根据 实际 需求 重新 设 定 面板 所 显示 的 内 容 , 添加 或 删除 所 要 显示 的 属性 , 其 至 是 整 
体 关闭 面板 展示 区 。 由 于 面板 可 以 显示 目标 属性 的 峰值 ， 当 需要 监控 具有 间 舱 性 峰值 的 系统 关键 
属性 时 ， 保 留 面板 还 是 有 必要 的 。 













































































Snage 


























































































































ŞS 对 自动 发 现 的 连接 所 做 的 修改 是 无 法 保存 的 。 如 果 想 要 保留 自 定义 配置 , 则 
需要 按照 第 6 章 所 介绍 的 内 容 来 配置 自 定 义 连接 。 











面板 展示 区 默认 显示 Used Java Heap, JVM CPU Usage fil Live Set + Fragmentation 属性 
的 当前 值 和 峰值 。 其 中 ， 对 Live Set + Fragmentation 的 属性 值 的 统计 相对 简单 ， 只 需要 在 执行 
垃圾 回收 时 累加 即 可 。 如 果 该 面板 中 没有 显示 任何 数值 ， 则 表明 JVM 还 没有 过 垃圾 回收 。 


| GS 点 击 运 行 时 标签 组 中 内 存 标签 页 Runtime | Memory 的 垃圾 桶 图 标 | 面 |， 可 | 
































以 强制 JVM 执行 垃圾 回收 。 





CPU 资源 很 宝贵 ， 最 好 使 其 能 持续 饱和 运行 。 例 如 ， 对 于 密集 计算 的 批 处 理应 用 程序 来 说 ， 
为 了 能 够 尽快 完成 计算 任务 ， 充 分 利用 CPU 资源 是 很 重要 的 。 但 一 般 来 说 ， 为 了 使 应 用 程序 仍 
可 响应 请 求 ， 不 可 使 CPU 工作 太 过 饱和 ， 需 要 预 留 一 部 分 缓冲 空间 。 如 果 CPU 使 用 率 过 高 ， 就 
需要 考虑 提升 硬件 性 能 ， 或 检查 应 用 程序 的 实现 细节 ， 如 它 所 采用 的 数据 结构 和 算法 。JRockit 
Flight Recording 可 以 帮助 开发 人 员 找 出 CPU 资源 都 消耗 在 了 哪里 。 
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若 堆 中 存活 对 象 所 占 的 比重 非常 大 , 会 提升 垃圾 回收 的 执行 频率 ,从 而 增加 垃圾 回收 器 的 执 
行 开销 。 如 果 Live Set + Fragmentation 面板 中 的 计数 保持 在 一 个 较 高 的 水 平 ， 而 垃圾 回收 器 的 
执行 效率 又 不 高 ， 可 以 考虑 增 大 内 存 堆 的 大 小 来 提升 运行 性 能 。 如 果 Live Set + Fragmentation 
面板 的 计数 随 着 时 间 的 推移 而 稳步 增长 ， 则 有 可 能 是 发 生 了 内 存 泄漏 。 第 10 章 会 详细 介绍 内 存 

平台 MBean 服务 器 提供 了 对 MBean 属性 值 变 化 的 订阅 服务 ， 其 中 既 包 括 应 用 程序 服务 器 
MBean 的 属性 ， 也 包括 用 户 执 行 注册 到 平台 MBean 服务 器 中 的 MBean 的 属性 ， 例 如 WebLogic 
Server 中 的 OpenSessionsCurrentCount 属性 。 









































默认 情况 下 ，WebLogic Server 并 没有 使 用 平台 MBean 服务 器 。 如 果 想 要 监 
控 WebLogic Server MBean 和 平台 所 提供 的 其 他 MBean， 对 WebLogic Server 做 
简单 配置 即 可 。 详 细 步 又 ， 请 查询 WebLogic Server 的 相关 文档 。 
SS WebLogic Server 官方 的 建议 是 ， 不 要 使 用 平台 MBean 服务 器 ， 因 为 这 具有 
安全 隐患 ， 尤 其 是 当 运 行 在 其 中 的 应 用 程序 不 可 完全 信任 时 。 此 时 ， 如 果真 的 要 
启用 平台 MBean 服务 器 , 一 定 要 先 弄 清楚 潜在 的 安全 威胁 , 因为 运行 在 JVM 中 
的 所 有 代码 都 可 以 访问 WebLogic MBean。 








面板 展示 区 下 面 的 两 个 图 分 别 展 示 CPU 和 内 存 的 使 用 情况 。 其 中 ，CPU 使 用 情况 展示 为 一 
系列 百分比 的 点 , 每 个 点 都 表示 将 所 有 核 都 考虑 在 内 的 平均 使 用 率 。 对 于 内 存 使 用 来 说 , 已 使 用 
的 堆 内 存 表 示 当 前 所 使 用 的 内 存 数量 占 堆 总 容量 的 百分比 , 已 使 用 的 物理 内 存 表示 所 用 内 存 数 量 
占 可 用 物理 内 存 总 量 的 百分比 。 

要 跟踪 存活 对 象 集合 和 碎片 化 情况 ， 可 以 持续 跟踪 内 存 展示 区 中 已 使 用 堆 内 存 的 曲线 变化 。 

在 下 面 的 截图 中 ， 参 考 垃圾 回收 结束 和 内 存 回 收 之 后 的 内 存 使 用 量 ， 可 以 画 出 一 条 假想 线 ， 
从 中 可 以 推测 出 在 垃圾 回收 过 程 中 存活 对 象 集合 容量 的 变化 。 
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当然 ， 直 接 在 展示 区 中 添加 一 条 显示 Live Set + Fragmentation 数值 的 线 可 以 更 方便 地 观察 
其 变化 趋势 。 

从 下 面 的 截图 中 可 以 看 到 ，Live Set + Fragmentation 的 数值 不 断 增 长 ， 说 明 很 有 可 能 发 生 
了 内 存 泄漏 的 情况 。 如 果 置 之 不 理 ， 最 终 会 使 应 用 程序 因 OutofMemoryError 错误 而 退出 。 
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~ Memory SOP. 
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PRA f kg Add... ES Remove 
用 户 可 以 根据 实际 需要 添加 或 删除 想 要 观察 的 属性 ,为 便于 与 其 他 已 有 的 属性 区 分 开 , 用 户 
可 以 自 定 义 属性 的 展示 颜色 。 
另 一 个 容易 被 忽视 的 特性 是 ， 在 冻结 图 表 后 ， 可 以 获取 到 额外 的 信息 。 通 过 刷新 按钮 [PS] 关 
闭 图 表 中 的 数据 更 新 后 ， 会 在 图 中 指针 的 旁边 显示 出 当前 数据 的 相关 信息 ， 如 下 图 所 示 。 


+ Processor 加 里 


| | Machine CPU Usage 
E VM CPU Usage 
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当 在 曲线 图 中 选择 某 一 区 域 进行 缩放 操作 时 ,会 自动 暂停 数据 更 新 。 若 想 在 展示 区 中 选择 某 

区 域 ， 只 需 左 键 点 击 展示 图 图 形 并 在 时 间 轴 上 拖 动 即 可 。 点 击 右键 菜单 , 即 可 选择 具体 的 缩放 
操作 。 
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v Processor SOR 
= | | Machine CPU Usage 
a | 国 wM CPU Usage 
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0 Zoom 上 Selection 
Y-axis Range » Seconds 
x Edit Titles » Minutes 
= Export as Image... Hours 
5 一 ae Nao, Log to Historical Data Zoom In 1 mi r 
13:30 13532 Zoom Out (Ec Remove | ae 























默认 情况 下 , 立轴 显示 的 数值 是 0 到 100. FEMI HEN, A PEELE el, Wp 
新 调整 显示 区 间 。 下 面 的 截图 添加 了 Total Loaded Class Count 属性 值 的 显示 曲线 , 该 曲线 所 表 
示 的 值 会 超出 默认 显示 范围 。 若 希望 展示 区 能 自动 调整 Y 轴 的 显示 范围 ， 可 以 右键 点 击 展 示 区 ， 
选择 菜单 中 的 立轴 范围 使 其 自动 始终 显示 零 Y-axis Range | Auto, alwaysshow zero. 
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选择 显示 区 间 并 不 会 修改 原始 数据 ， 百 分 比 区 间 为 0~ 100%， 值 得 注意 的 
是 ， 当 属性 值 为 1 时 ， 并 不 会 显示 为 100%。 





若 属性 值 介 于 0 和 1 之 间 , 将 其 乘 以 一 个 倍增 系数 ， 便 可 正确 显示 在 百分比 展示 区 中 。 例 如 
CPU 使 用 率 统计 数据 ， 倍 增 系 数 为 100。 右 键 点 击 属性 标签 ， 选择 Edit Pre-multiplier 可 对 预 设 
倍增 系数 进行 编辑 ， 如 下 图 所 示 。 
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Management Console 中 的 数据 图 表 包 含 了 很 多 内 容 ， 通 过 查看 上 下 文 菜单 可 以 找到 相关 信息 。 
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7.2.2 MBean 标签 组 


MBean 标签 组 中 的 内 容 均 与 MBean 的 查看 、 操 作 、 订 阅 和 创建 触发 器 等 操作 相关 ， 它 包含 
两 个 标签 页 ， 即 MBean 浏览 需 标 签 页 和 触发 器 标签 页 。 其 中 ，MBean 浏览 器 标签 页 用 于 查看 注 
册 在 平台 MBean 服务 器 中 的 MBean 及 其 属性 ， 触 发 器 标签 页 用 于 创建 针对 特定 条 件 的 触发 器 。 

1. MBean 浏览 器 

MBean 标签 组 的 第 一 个 标签 页 是 MBean 浏览 器 , 在 这 个 标签 页 中 可 以 查看 所 有 注册 在 平台 
MBean 服务 器 中 的 MBean 的 属性 ， 属 性 值 的 类 型 包括 原生 类 型 、 集 合 类 型 、 数 组 类 型 、 复 合 类 
型 和 列表 类 型 等 。 为 了 方便 查看 数据 , MBean 浏览 器 会 将 数据 分 组 显示 , 分 组 方式 可 以 在 首选 项 
菜单 中 修改 。 

在 MBean 浏览 器 中 ， 如 果 某 个 属性 以 粗 体 显示 ， 则 表明 该 属性 是 可 写 的 。 普 通 的 MBean 属 
性 可 以 直接 在 MBean 浏览 器 中 修改 。 例 如 ， 可 以 通过 在 oracle.jrockit.management 域 下 
的 名 为 Garbagecollector 的 MBean 来 修改 已 分 配 的 堆 的 大 小 ， 双 击 AllocatedHeapSize- 
Target 属性 值 即 可 , 不 必 担 心 属性 AllocatedHeapSize 的 值 没 有 随 之 一 起 变化 , 因为 JRockit 
可 能 会 因为 各 种 原因 ( 例如 内 存 对 齐 和 当前 内 存 使 用 量 ) 放弃 用 户 设 定 的 堆 大 小 ,而 自行 选择 合 
适 的 值 。 
默认 情况 下 ， 属 性 值 会 每 秒 ( 即 1000 毫秒 ) 更 新 一 次 。 若 想 自 定义 某 个 属性 的 更 新 时 间 间 
隔 ， 可 以 选中 该 属性 ， 然 后 点 击 Updates... 更 新 按钮 ， 在 弹出 的 对 话 框 中 修改 时 间 间 隔 即 可 。 

更 新 间隔 有 以 下 几 种 选择 。 

OK: 被 选中 的 属性 只 会 被 更 新 一 次 。 该 选项 适用 于 那些 属性 值 不 会 发 生变 化 的 属性 ， 






































































































































例如 机 器 的 CPU 数目 。 
O 默认 : 默认 的 更 新 闻 隔 设置 。 一 般 情 况 下 ， 默 认 间 隔 是 1000 毫秒 。 该 默认 值 可 以 在 窗口 
的 首选 项 中 修改 。 





O 定制 : 用 户 自 定义 以 毫秒 为 单位 的 更 新 间隔 。 
MBean 浏览 器 还 可 以 动态 调用 MBean 的 方法 。 当 试用 他 人 的 JMX API 或 建立 JMX API 原型 
时 ， 这 个 特性 会 非常 有 用 。 
例如 ， 在 MBean 浏览 器 中 ， 可 以 直接 调用 oracle.jrockit.management 域 下 名 为 
DiagnosticCommand 的 MBean 的 方法 。 有 关 诊 断 命令 的 内 容 会 在 本 章 后 续 部 分 和 第 11 章 中 
做 详细 介绍 。 
打开 操作 标签 页 ， 选 中 execute(String pl1) 操 作 ， 点 击 调用 按钮 可 以 打开 一 个 对 话 框 ， 
在 其 中 点 击 p1 即 可 设置 操作 需要 的 参数 ， 例 如 print_threads， 点 击 确定 后 ， 就 会 执行 相应 
的 操作 ， 在 此 处 则 会 打印 出 线程 的 调用 栈 信息 。 当 然 , 要 打印 线程 栈 信息 还 有 其 他 更 简便 的 办 法 
( 例如 直接 使 用 高 级 标签 组 中 诊断 命令 标签 页 内 容 的 相关 命令 )， 这 里 只 是 举 个 例子 加 以 说 明 。 
JRockit Mission Control Management Console 区 别 于 其 他 JMX 控制 台 的 地 方 在 于 ， 它 可 以 订 
阅 多 种 类 型 的 属性 值 ， 甚至 是 部 分 属性 值 。 例 如， 它 可 以 对 某 个 组 合 数据 属性 中 的 某 个 子 属性 值 
做 订阅 操作 。 
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(举例 如 下 。 在 MBean 浏览 器 中 , 找到 Old Space MBean( 准确 来 说 是 java. lang: type= 
MemoryPool:name=Old Space MBean Jo 

(2) 展开 Usage 属性 ， 选 择 组 合 数据 中 的 某 个 属性 ， 例 如 #useq。 

(3) 右键 点 击 该 属性 ， 选 择 可 视 化 ……。 

(4) 在 打开 的 对 话 框 中 ， 点 击 添加 图 表 。 

现在 回 到 一 般 信息 标签 组 的 概览 标签 页 中 ,将 Y 轴 的 值 改 为 auto， 默 认 是 0 到 100 的 固定 
范围 。 

订阅 可 以 基于 JMX 通知 和 合成 属性 (synthetic attribute ) 来 完成 。 一 般 来 说 ， 合 成 属性 都 有 
一 个 对 应 的 实现 类 , 用 于 实现 获取 数据 的 具体 方法 ， 由 于 实现 方法 由 实现 者 自行 决定 ， 基 于 合成 
属性 的 订阅 可 以 从 任何 数据 源 获取 数据 , 甚至 没有 JMX 也 是 可 以 的 ,LiveSet 就 是 一 个 合成 属性 ， 
其 属性 值 是 通过 基于 通知 的 垃圾 回收 属性 和 一 些 其 他 信息 计算 出 来 的 。 如 果 选 中 某 个 定义 了 通知 
的 MBean， 则 可 以 在 名 为 通知 的 标签 页 中 订阅 相关 信息 。 不 过 ， 大 部 分 MBean 都 没有 定义 通知 
操作 。 

举例 如 下 。 

(1) Æ oracle.jrockit.management 域 下 ， 选 择 GarbageCollector 这 个 Mbean。 

(2) 选择 通知 标签 页 。 

(3) 色 选 订阅 复 选 框 。 

(4) 进入 操作 标签 页 。 

(5) 执行 垃圾 回收 操作 。 

(6) 回 到 通知 标签 页 ， 可 以 看 到 订阅 信息 。 

依据 垃圾 回收 器 和 JRockit 版 本 的 不 同 ， 在 通知 标签 页 中 所 显示 的 订阅 信息 也 不 尽 相 同 。 

其 他 有 关 通 知 的 内 容 请 参见 java.lang.management .MemoryPoolMXBean fl java.lang: 
Memory 这 两 个 MBean 的 说 明文 档 。 

通知 标签 页 本 身 没有 特别 之 处 ， 只 不 过 是 执行 JMX API 而 已 ， 而 它 在 订阅 服务 时 却 非常 有 
用 ， 因 此 可 用 于 实现 属性 的 可 视 化 展示 。 
















































































不 幸 的 是 ,目前 还 没有 官方 文档 对 合成 属性 和 基于 合成 属性 的 通知 做 详细 说 
明 。 现 在 只 能 通过 在 attributes.xml 文件 中 搜索 与 flavour="synthetic" 
和 flavour="Notification" 相关 的 内 容 看 个 大 概 ， 该 文件 位 于 
com.jrockit.mc.rjmx 插件 中 。 如 果 你 想 获得 这 方面 内 容 的 官方 支持 ， 请 联 
系 本 书 作 者 。 


2. 触发 器 

在 Management Console 中 ， 用 户 可 以 根据 业务 需要 定制 触发 器 的 规则 ， 包 含 以 下 3 部 分 。 
(1) 触发 条 件 : 指明 在 何 种 情况 下 触发 ， 例 如 当 CPU 负载 超过 90% 时 触发 。 

(2) 动作 : 指明 满足 触发 条 件 时 要 做 的 操作 ， 例 如 发 送 一 封 警报 邮件 。 
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(3) 约束 条 件 : 指明 除了 触发 条 件 外 , 还 需要 满足 哪些 限制 条 件 才 能 执行 预定 义 的 动作 。 例 如， 
“只 在 工作 日 ”和 “在 9:00 AM 和 6:00 PM 之 间 ”。 

在 触发 器 标签 页 中 ,可 以 添加 、 移 除 激活、 禁用 和 编辑 触发 器 规则 。 从 Rockit Mission Control 
3.1 开 始 ， 还 可 以 对 触发 需 规 则 做 导 和 人 和 导出 操作 。 

若 要 简单 修改 已 有 的 触发 器 规则 , 例如 修改 要 执行 的 动作 或 触发 冰 值 , 直接 在 规则 详细 资料 
(tule detail ) 中 修改 即 可 。 在 之 前 的 示例 中 ,触发 器 规则 都 没有 激活 。 若 要 激活 某 个 触发 器 规则 ， 
只 需 在 左 侧 触 发 器 规则 的 属性 菜单 中 你 选 指定 触发 器 的 名 字 即 可 。 

JRockit Mission Control 自 带 了 各 种 类 型 的 示例 规则 。 为 了 便于 说 明 , 这 里 创建 一 个 和 已 有 规 
则 相同 的 触发 器 规则 。 

(1) 点 击 Add... 按 钮 ， 弹 出 添加 新 规则 Add New Rule 对 话 框 。 

(2) 找到 名 为 oracle.jrockit .management .Runtime 的 Mbean。 

(3) 选择 CPULoad 属性 。 该 属性 名 前 面 的 图 标 图 | 指明 了 该 属性 值 是 数值 类 型 。 创 建 触发 央 
规则 时 ， 所 选择 的 属性 可 以 是 数值 类 型 或 字符 串 类 型 。 

(4) 点 击 Next， 在 最 大 触发 值 (max trigger value) 中 设置 触发 动作 的 靖 值 ， 例 如 0.25。 触 发 
器 对 原始 值 操作 ， 所 以 预 乘 数 无 效 。 这 里 的 0.25 是 指 ， 当 CPU 负载 达到 25% 时 ， 就 触发 指定 动 
作 。 当 CPU 负载 低 于 25% 时 ， 会 恢复 。 

(5) 除了 效 值 外 ， 还 有 一 些 其 他 触发 选项 。 


























































































































O 持续 时 间 [ 秒 ]: 指定 属性 值 达到 阔 值 水 平 ， 并 保持 多 和 久之 后 ， 才 会 触发 预定 动作 。 

O 限制 时 间 段 [ 秒 ]: 指定 当 达 到 阔 值 , 过 了 多 入 后 就 不 再 触发 预定 动作 。 触 发 次 数 过 多 的 
事件 会 直接 被 废弃 掉 。 

O 满足 条 件 时 触发 : 在 这 个 示例 中 ， 当 属性 值 从 小 于 0.25 变化 到 大 于 或 等 于 0.25 时 ， 
就 会 触发 预定 动作 。 

口 根据 条 件 恢 复 时 触发 : 在 这 个 示例 中 ， 当 属性 值 从 大 于 或 等 于 0.25 变化 到 小 于 0.25 
时 触发 预定 动作 。 


(6) 点 击 Next 进入 应 用 程序 预警 (Application alert ) 对 话 框 。 
使 用 应 用 程序 预警 无 须 额 外 配置 。 当 关联 了 应 用 程序 预警 机 制 的 规则 被 触发 后 , 会 记录 被 触 
发 的 事件 , 并 根据 配置 来 判断 是 否 要 在 日 志 窗 口中 展示 。JRockit Mission Control 提供 了 一 些 默认 
的 预警 操作 ， 用 户 还 可 以 根据 实际 需要 自 定义 预警 操作 。 有 关 自 定义 预警 操作 的 内 容 ， 请 参见 
7.3 节 的 介绍 。 

(7) 点 击 Next 选择 约束 条 件 。 

就 这 个 示例 来 说 ， 其 实 并 不 需要 约束 条 件 , 这 里 只 是 举例 加 以 说 明 , 例如 可 以 选择 只 在 工作 
日 触发 。 为 了 更 好 地 配合 业务 需要 ， 用 户 也 可 以 自 定义 约束 条 件 。 

(8) 点 击 Next 查看 规则 名 称 和 规则 组 名 称 。 

为 了 便于 区 别 不 同 的 规则 , 可 以 在 说 明 输 入 框 中 添加 当前 规则 的 说 明 内 容 , 这 里 可 以 使 用 标 
HE HTML 标签 (例如 <b>、</b>、<br/> 等 ) 对 内 容 修饰 。 

(9) 点 击 Finish 结 
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(10) 在 触发 器 规则 展示 区 中 找到 刚刚 创建 的 规则 ， 勾 选 复 选 框 以 启用 该 规则 。 

(11) 试 着 增加 CPU 负载 以 触发 自 定义 的 规则 。 通 常情 况 下 ， 重 画 U 窗口 就 可 以 增 大 CPU, 
例如 重 设 窗口 大 小 。 

当 达 到 预 设 的 CPU 负载 后 ， 会 弹出 触发 预警 对 话 框 。 
用 户 可 以 根据 业务 需要 自 定 义 触 发 动作 和 约束 条 件 。 这 个 功能 是 通过 预定 义 的 扩展 点 创建 自 
定义 捅 件 来 实现 的 。 详 细 内 容 请 参见 7.3 节 的 介绍 。 
































7.2.3 ”运行 时 标签 组 


运行 时 标签 组 中 对 JRockit 运行 时 信息 做 了 可 视 化 展示 。 该 标签 组 中 的 第 一 个 标签 页 是 系统 
标签 页 。 

1. 系统 标签 页 

该 标签 页 中 最 有 用 的 功能 是 可 进行 过 滤 操 作 的 系统 属性 表 。 过 滤 的 时 候 可 以 选择 是 按照 属性 
的 名 字 ， 还 是 属性 值 。 例 如 ， 若 只 想 查 看 属性 名 以 java .vm 开头 的 属性 ， 直 接 在 过 滤 框 中 输入 
java.vm 即 可 。 















































在 过 滤 框 中 可 以 使 用 正则 表达 式 ， 只 需 在 输入 内 容 前 添加 regexp: HAP 
可 。 例 如 ， 若 想 查看 所 有 属性 名 以 sun .开头 ， 以 path 结尾 的 属性 ， 则 可 以 使 
用 正则 表达 式 regexp:sun\..*pathe 











默认 情况 下 ， 在 系统 统计 信息 展示 区 中 会 显示 一 些 常用 的 属性 值 。JRockit Mission Control 
中 的 大 部 分 表格 都 只 显示 了 一 部 分 列 ， 用 户 可 以 通过 上 下 文 菜单 (可 见 的 列 |< 列 名 > ) 或 点 击 表 
设置 按钮 | 国 ， 在 打开 的 对 话 框 中 选择 要 显示 的 列 。 在 上 面 的 截图 中 ， 通 过 表 设 置 新 增 了 更 新 时 
间 这 一 列 ， 用 来 展示 属性 值 的 更 新 时 间 。 注 意 ， 不 同 的 表格 可 能 会 展示 不 同 的 列 。 

从 示例 中 可 以 看 出 ， 不 同属 性 有 不 同 的 更 新 策略 。 例 如 ，JVM Version 的 值 就 根本 不 会 发 

生变 化 ， 而 在 应 用 程 说 运行 过 程 中 ， CPU 数量 也 基本 不 会 发 生变 化 。 用 户 可 以 在 MBean 浏览 器 

视图 中 修改 属性 的 更 新 策略 。 

2. 内 存 标签 页 

该 标签 页 用 于 展示 与 内 存 相关 的 信息 。 在 标签 页 顶部 , 是 与 概览 标签 页 中 相 类 似 的 数据 展示 
K, 下 面 是 两 个 属性 表 。 第 一 个 包含 了 一 些 内 存 统计 信息 , 第 二 个 包含 了 与 垃圾 回收 相关 的 属性 
信息 ,其 中 的 一 些 值 会 在 应 用 程序 运行 过 程 中 发 生 改 变 , 例如 已 分 配 的 堆 的 大 小 、 垃 圾 回收 策略 
和 垃圾 回收 器 的 相关 信息 等 。 

垃圾 回收 需 会 根据 预 设 的 优化 目标 使 用 启发 式 算法 来 动态 调整 垃圾 回收 策略 及 相关 参数 , 其 
优化 目标 包括 最 大 化 系统 吞吐 量 和 最 小 化 暂停 时 间 。 

不 同 版 本 的 Rockit 可 能 使 用 了 不 同 的 启发 式 算法 。 就 R28 版 本 来 说 ， 垃 圾 回收 的 启发 式 算 
法 是 通用 的 , 可 以 根据 应 用 程序 的 实际 运行 情况 来 调整 相关 参数 , 不 过 不 可 以 将 启发 式 算法 调整 
到 另 一 种 aeterministic， 这 是 因为 在 启动 准确 式 垃圾 回收 器 ( JRockit real time ) 时 ， 会 根据 
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预 设 的 启发 式 算法 启用 很 多 专用 的 数据 结构 和 配置 信息 。 
垃圾 回收 策略 由 新 生 代 、 标 记 策 略 和 清理 策略 组 成 。 其 中 ,新 生 代 可 能 并 不 存在 ,标记 策略 
和 清理 策略 可 以 选择 是 并 发 或 是 并 行 ， 具 体内 容 请 参见 第 3 章 中 的 介绍 。 
在 R28 版 本 中 , 如果 启动 JRockit JVM 时 , 通过 命令 行 参数 -xgc : singlepar 显 式 指定 了 垃 
圾 回收 策略 , 则 启发 式 算 法 就 无 法 根据 运行 时 反馈 信息 来 调整 垃圾 回收 策略 了 ; 而 如 果 启 动 JVM 
时 ， 指 定 了 其 他 垃圾 回收 策略 ， 则 可 以 将 之 调整 为 singlepar。 
以 CMS 垃圾 回收 算法 为 例 ， 其 垃圾 回收 策略 的 全 名 为 Concurrent Mark & Sweep, 
generational=false, sweep=concurrent, mark=concurrent, 这 个 名 字 实 在 太 长 了 3 
在 第 3 章 中 曾经 提 到 过 ， 当 使 用 命令 行 参 数 -xgc 时 ， 只 需要 使 用 singlecon 就 可 以 代表 这 个 完 
整 的 策略 名 。 知 想 查看 不 同 垃圾 回收 策略 的 全 名 , 只 需 查找 名 为 oracle.jrockit.management : 
GarbageCollector 的 MBean 即 可 ， 其 中 的 每 个 属性 对 应 了 一 种 垃圾 回收 策略 全 名 ， 每 个 属性 值 都 
包含 了 一 组 compositeData, MRS CompositeData 都 包含 了 一 个 name 域 和 一 个 description 
Jak, name 域 的 值 就 是 垃圾 回收 策略 的 全 名 , 可 作为 输入 内 容 修改 Strategy 或 Heuristic 属性 。 
调整 垃圾 回收 策略 的 同时 还 会 对 垃圾 回收 的 启发 式 算法 产生 影响 。 使 用 并 发 垃圾 回收 策略 会 
使 启发 式 算法 更 关注 应 用 程序 的 暂停 时 间 , 使 用 并 行 垃圾 回收 策略 会 使 启发 式 算法 更 关注 系统 知 
吐 量 。 同 样 地 ， 调 整 启 发 式 算法 也 会 对 垃圾 回收 策略 产生 影响 。 
值得 注意 的 是 , 在 应 用 程序 运行 过 程 中 调整 启发 式 算法 或 垃圾 回收 策略 ,以 及 在 启动 应 用 程 
序 时 就 设置 好 启发 式 算法 和 垃圾 回收 策略 并 不 相同 。 原 因 有 两 个 。 
O 在 运行 过 程 中 调整 启发 式 算 法 使 之 更 关注 暂停 时 间 时 ， 如 果 先 前 没有 启用 可 中 止 整理 
( abortable compaction )， 则 调整 后 并 不 会 为 此 启用 某 些 必要 的 数据 结构 ， 此 时 二 圾 回收 器 
就 无 法 使 用 可 中 止 整理 。 
口 TLA 的 大 小 是 根据 启动 参数 计算 得 出 的 。 调 整 垃圾 回收 策略 或 启发 式 算法 并 不 会 重新 计 
算 TLA 的 大 小 。 
3. 线程 标签 页 
线程 标签 页 中 包含 了 当前 正在 运行 的 线程 的 相关 信息 。 当 前 系统 中 的 所 有 线程 都 会 列 在 一 个 
表格 中 。 选 中 其 中 的 某 个 线程 后 ，Management Console 会 打印 出 该 线程 的 调用 栈 信息 。 在 右 侧 ， 
可 以 通过 勾 选 复 选 框 来 启用 CPU 概要 分 析 、 死 锁 检 测 和 内 存 分 配 概要 分 析 几 项 功能 ， 会 在 线程 
列表 中 显示 相应 的 统计 数据 .点击 右 上 角 的 表 设 置 按钮 ,在 其 中 列 出 了 更 多 有 关 线程 的 详细 数据 ， 
用 户 可 根据 自身 需要 自行 设置 。 
勾 选 了 锁 持 有 者 名 字 (lock owner name ) 和 和 死 锁 检测 (deadlock detection ) 后 ， 会 在 两 列 中 
分 别 显示 出 各 自 的 内 容 。 


死 锁 检测 可 算是 JRockit Management Console 的 一 大 亮点 ， 对 于 调试 并 行 应 
| 



























































































































































用 程序 来 说 ， 非 常 有 用 。 


在 Management Console 中 还 有 一 个 容易 被 忽略 的 特性 就 是 CPU 概要 分 析 。 在 启用 CPU 概 
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要 分 析 后 ，Management Console 会 显示 出 每 个 线程 的 CPU 使 用 情况 ， 并 以 柱状 图 展示 。 
启用 内 存 分 配 概要 分 析 (allocation profiling ) 后 ， 会 显示 出 该 线程 中 已 经 分 配 的 内 存 数量 。 
注意 ， 该 数值 是 该 线程 运行 以 来 所 分 配 的 内 存 的 总 量 ， 而 不 是 该 线程 当前 所 使 用 的 内 存 数量 。 























7.2.4 ”高 级 标签 组 


高 级 标签 组 中 包含 的 功能 在 使 用 上 有 些 复 杂 ， 因 为 它们 可 能 会 影响 性 能 ， 或 要 求 用 户 对 
JRockit JVM 的 内 部 原理 有 一 定 了 解 。 本 节 将 会 简单 介绍 其 中 的 功能 。 

1. 方法 概要 分 析 

在 方法 概要 分 析 标 签 页 中 , 可 以 对 指定 类 型 的 方法 的 执行 情况 做 概要 分 析 。 不 同 于 基于 采样 
的 方法 分 析 , 准确 分 析 意 味 着 精确 地 记录 方法 调用 次 数 和 执行 方法 的 总 时 间 。 在 第 8 章 和 第 9 章 
会 详细 介绍 基于 采样 的 方法 分 析 。 

在 添加 方法 概要 分 析 之 前 ， 要 先 关 闭 已 有 的 概要 分 析 ， 然 后 为 待 分 析 的 方法 选择 一 个 模板 ， 
或 点 击 添加 按钮 来 新 建 一 个 模板 。 模 板 不 仅 可 以 保存 常用 的 设置 , 方便 下 次 访问 , 还 可 以 快速 打 
开 、 关 闭 对 某 一 组 方法 的 概要 分 析 。 

在 为 新 模板 设置 了 名 字 之 后 ， 需 要 为 被 选中 的 模板 选择 带 分 析 的 类 。 

Tri Aas (method profiler ) 会 从 JVM 中 抓 取 目 标 类 的 方法 信息 ,以 树 形 菜单 的 形式 列 出 。 

如 果 启 用 了 对 模板 中 某 个 类 或 方法 的 概要 分 析 , 则 会 在 概要 分 析 信息 展示 区 中 列 出 相关 方法 

的 调用 信息 。 若 没有 启用 的 话 ， 只 需 勾 选 方 法 名 或 类 名 前 的 复 选 框 即 可 。 

在 控制 面板 展示 区 中 ， 有 启动 [BI 和 关闭 男 分 析 带 的 按钮 。 

使 用 方法 分 析 器 时 ， 有 一 些 事情 需要 特别 注意 。 

口 如 何 指定 待 分 析 方 法 集合 : 这 是 一 个 “ 先 有 鸡 还 是 先 有 和 蛋 ” 的 问题 ， 因 为 在 做 详细 分 析 
之 前 ， 很 难 知道 到 底 需 要 对 哪些 方法 做 分 析 ， 在 真正 做 了 方法 分 析 之 后 ， 才 能 知道 哪些 
方法 是 性 能 瓶颈 。 

口 难以 衡量 准确 分 析 所 带 来 的 性 能 损耗 : 由 于 方法 分 析 器 不 是 基于 采样 分 析 的 ， 很 难 准确 
预测 分 析 所 带 来 的 执行 开销 ， 对 于 那些 执行 时 间 不 长 或 执行 频繁 的 方法 来 说 ， 想 准确 统 
计 方 法 的 时 间 信 息 更 是 难 上 加 难 。 如 果 对 应 用 程序 中 所 有 的 热 方法 都 做 概要 分 析 ， 随 之 
而 来 的 执行 开销 是 相当 大 的 。 

口 无 法 获得 当前 类 载 入 器 信息 : 分 析 器 只 会 分 析 它 所 找到 第 一 个 相 匹 配 的 类 ， 因 此 ， 如 果 
某 个 类 被 多 个 类 载 人 器 载 人 ， 分 析 器 就 无 法 准确 找到 目标 类 。 



































































































































当 出 现 性 能 瓶颈 时 ,开发 人 员 通 常会 对 目标 方法 做 性 能 优化 。 一 般 情 况 下 已 
经 对 该 方法 进行 了 大 量 精准 的 测量 ,优化 之 后 它 会 运行 得 更 快 。 但 不 幸 的 是 ， 应 
用 程序 的 整体 性 能 仍旧 没有 改善 ， 执 行 JRockit Flight Recording 后 发 现 ， 根 本 原 
AAT, 被 优化 的 方法 并 不 是 应 用 程序 的 热 方法 ， 因 此 ， 即 使 花费 大 量 精力 对 其 
优化 ， 也 只 是 浪费 时 间 而 已 。 


7.2 Management Console 177 








在 分 析 应 用 程序 的 执行 性 能 时 ,最 好 先 从 启用 SRockit Flight Recorder 开始 。 如 果 在 记录 了 应 
用 程序 运行 状况 后 ,还 是 想 在 线 执行 准确 方法 分 析 , 应 该 确认 这 样 做 是 有 必要 的 。 在 保存 了 运行 
记录 后 ， 就 可 以 清楚 地 知道 应 用 程序 都 把 时 间 花 在 了 哪里 ， 以 及 是 否 值得 。 你 可 能 想 知道 代码 优 
化 如 何 影响 计时 信息 (如果 目标 代码 位 于 关键 路 径 上 ,那么 在 代码 优化 之 后 , 不同 的 测量 方法 可 
能 会 带 来 不 同 的 性 能 损耗 )， 或 是 仅仅 想 知道 某 个 方法 是 否 被 调用 了 ， 在 我 看 来 ， 这 正 是 方法 概 
要 分 析 的 价值 所 在 。 

2. 异常 标签 页 

异常 标签 页 用 于 显示 应 用 程序 所 抛 出 的 异常 的 数量 , 用 户 可 以 根据 实际 需要 来 选择 是 统计 指 
定 类 型 的 异常 ， 还 是 统计 某 个 指定 类 型 及 其 子 类 型 的 所 有 异常 。 

这 里 的 功能 比较 有 限 ， 还 不 能 显示 出 异常 栈 信息 。 如 果 想 知道 异常 时 从 何 处 的 抛 出 的 , 抛 出 
了 多 少 异常 ， 则 应 该 选择 使 用 JRockit Flight Recorder, 或 者 启用 详细 日 志 记 录 。 更 多 有 关 JRockit 
Flight Recorder 的 内 容 , 请 参见 第 9 章 。 有 关 如 何 记录 详细 日 志 的 内 容 , 请 参见 第 5 章 和 第 11 章 。 

3. 诊断 命令 标签 页 

诊断 命令 标签 页 可 以 访问 到 JRockit JVM 内 部 的 一 些 诊断 命令 ， 这 些 命令 会 通过 JRockit 
Management API 或 命令 行 根据 JRCMD 发 送 给 目标 JRockit JVM. 































































































ŞS 更 多 有 关 诊 断 命令 本 身 和 IRCMD 的 内 容 ， 请 参见 第 11 #, AX JRockit 
Management API 的 内 容 ， 请 参见 第 12 章 。 














诊断 命令 左上 角 的 列表 框 中 列 出 了 3 组 不 同类 型 的 诊断 命令 , 分 别 是 普通 、 高 级 和 内 部 。 普 
WA, 顾名思义， 可 以 在 生产 环境 下 执行 ， 不 会 带 来 负面 影响 。 当 然 ， 也 有 例外 ,例如 ,反复 执 
行 runsystemgc 命令 可 能 会 带 来 性 能 损耗 ,执行 print_object_summary 命令 则 可 能 会 触发 
一 次 垃圾 回收 (这 是 因为 该 命令 会 遍历 堆 来 收集 所 有 对 象 的 相关 信息 )。 

高 级 组 ， 其 中 的 命令 相对 复杂 一 些 , 需要 了 解 很 多 低层 级 的 Rockit 或 JVM 的 知识 ， 有 些 命 
邻 可 能 会 带 来 安全 和 性 能 方面 的 问题 。 例 如 ，heap_dqiagnostic 命令 的 执行 开销 就 比较 大 ， 而 
start_management_server 命令 由 于 会 启动 外 部 管理 工具 ， 从 而 带 来 安全 问题 。 

在 命令 列表 上 面 ， 是 一 个 筛选 器 ， 有 助 于 快速 找到 所 需 的 命令 ， 命 令 列表 的 右 侧 是 与 该 命令 
相关 的 参数 。 

点 击 执行 按钮 就 会 在 目标 JVM 中 执行 当前 选中 的 诊断 命令 ， 命 令 结束 后 ， 会 在 标签 页 底 前 
的 诊断 命令 输出 展示 区 中 显示 命令 执行 结果 。 注意 ， 有 些 诊断 命令 并 不 会 有 输出 ,它们 只 是 通知 
JRockit JVM 执行 一 些 动作 。 

点 击 诊断 命令 输出 (diagnostic command output ) 展示 区 右上 角 的 附加 输出 (append result ) 
按钮 ， 可 以 将 多 个 诊断 命令 的 执行 结果 输出 到 一 起 。 









































7.2.5 其 他 标签 组 


当 用 户 安 装 了 自 定义 标签 后 ， 就 会 出 现 一 个 额外 的 标签 组 一 一 其 他 标签 组 。 最 常见 的 是 
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JRockit Meta Plugin 标签 页 ， 可 以 从 更 新 点 中 添加 。 下 面 的 内 容 会 对 其 做 简单 介绍 。 

JConsole 

在 JDK 中 ， 附 带 了 一 个 名 为 JConsole 的 JMX 管理 控制 台 。 在 IDK 6.0 版 本 中 ，JConsole 中 
包含 了 插件 接口 ， 可 通过 插件 接口 添加 额外 的 标签 页 。 针 对 JRockit Mission Control 的 JConsole 
插件 使 它们 得 以 运行 在 J 人 Rockit Management Console 中 。 

若 想 运行 JConsole 插 件 ,JRockit Mission Control 或 者 Eclipse, 如 果 是 在 Eclipse 中 运行 JRockit 
Mission Control 的 话 ) 的 版 本 至 少 是 IDK 6.0， 并 配合 及 ockit 一 起 使 用 。JConsole 插件 会 自动 寻 
找 随 IDK 一 起 发 行 的 JTop 插件 ( 该 插件 的 位 置 在 demo/management/JTop 文件 夹 下 )， 并 以 该 文 
件 夹 作为 JConsole 插件 目录 。JConsole 插件 目录 下 所 有 包含 了 JConsole 插件 的 jar 包 都 会 在 
JConsole 插件 标签 下 拥有 自己 的 标签 页 。 

JConsole 插件 目录 和 插件 更 新 时 间 间 隔 是 可 修改 的 ， 具 体位 置 在 首选 项 菜单 下 。 







































































7.3 扩展 JRockit Mission Control Console 


本 节 将 会 介绍 如 何 扩展 JRockit Mission Control 的 Management Console， 读 者 在 阅读 之 前 ， 
请 先 了 解 一 些 Eclipse 平台 的 相关 技术 及 术语 ， 例 如 扩展 点 和 FormPage。 

可 以 使 用 控制 台 的 扩展 点 实现 自 定 义 标签 。 例 如 ， 从 JRockit Mission Control 更 新 点 创建 
JConsole 插件 标签 页 时 ， 就 有 扩展 点 可 用 。 有 关 更 新 点 的 内 容 ， 请 参见 第 6 章 的 介绍 。 

自 定义 JRockit Mission Control Console 插件 最 简单 的 方法 是 使 用 PDE (plugin developement 
environment ) HJC, #48 Eclipse for RCP/Plug-in Develpers ( Eclipse 3.5/Ganymede 或 更 高 版 本 ), 
然后 ， 在 Eclipse 中 安装 JRockit Mission Control 插件， 最 后 从 更 新 点 安装 PDE 集成 插件 。 

















PDE， 是 帮助 创建 、 开 发 、 调 试 、 构 建 和 部 署 Eclipse 插件 的 一 套 开 发 工具 。 
PDE 集成 插件 专门 提供 了 模板 来 简化 创建 JRockit Mission Control 插件 的 工作 。 








PDE 可 用 于 生成 项 目 模板 代码 ， 以 简化 创建 TRockit Mission Control Console 插件 的 工作 ， 这 
些 模板 代码 展示 了 如 何 创 建 自 定义 标签 页 。 

在 PDE 中 ， 有 简单 和 高 级 两 种 方式 可 以 方便 地 实现 JRockit Mission Console Console 中 的 自 
定义 标签 。 简 单方 法 会 直接 创建 一 个 显示 CPU 负载 的 示例 标签 页 ， 而 高 级 方法 会 使 用 JRockit 
Mission Control Console 中 的 内 建 组 件 以 多 种 不 同 的 方法 来 展示 3 种 选中 的 属性 。 

本 节 将 会 介绍 如 何 创建 一 个 标签 页 项 目 。 

(1) 选择 菜单 文件 | 新 建 | 项 目 …… 

(2) 在 新 建 项 目 对 话 框 中 ， 选 择 Plug-in Project， 点 击 下 一 步 。 

(3) 为 项 目 取 个 名 字 。 通常 来 说 , 一 般 会 以 插件 的 主 包 名 来 命名 项 目 名 , 例如 com. example. 
mc.console.myplugino 


(4) 确认 正确 选择 了 目标 平台 (针对 JRockit Mission Console 3.1 的 Eclipse 3.4, 或 针对 JRockit 
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Mission Console 4.0 的 Eclipse 3.5 )。 

(5) 点 击 下 一 步 ， 选 择 搬 件 的 详细 属性 ， 然 后 再 次 点 击 下 一 步 。 

(6) 如 果 PDE 插件 安装 正确 , 这 是 就 应 该 可 以 看 到 几 种 不 同 的 模板 , 其 中 两 种 属于 高 级 方法 ， 
一 种 属于 简单 方法 。 选 择 其 中 一 种 ， 点 击 下 一 步 。 

(7) 修改 详细 信息 ， 点 击 完 成 。 

这 样 就 创建 了 一 个 插件 工程 ， 里 面包 含 了 自 定义 JRockit Mission Control Console 标签 页 的 必 
要 代码 。 想 要 测试 一 下 的 话 , 只 需 点 击 Run | Run Configurations. . ., 在 打开 的 Run Configurations 
Dialog 对 话 框 中 ， 右 键 点 击 Eclipse Application 选项 ， 选 择 New 创建 一 个 新 的 运行 配置 项 。 默 
认 情 况 下 ， 会 使 用 当前 已 经 运行 的 Eclipse 作为 自 定义 插件 的 运行 平台 ， 其 中 已 经 包含 了 JRockit 
Mission Control 插件 ， 所 以 一 切 都 很 正常 。 接 下 来 ， 选 中 这 个 新 建 的 运行 配置 项 ， 点 击 右 下 角 的 
Run 按钮 。 

这 时 ， 会 启动 一 个 新 的 Eclipse 来 部 署 这 个 自 定义 插件 ， 打 开 Mission Control 透视 图 ， 启 动 
控制 台 后 ， 就 可 以 在 其 他 标签 页 组 中 看 到 这 个 自 定义 的 标签 页 了 。 

如 果 使 用 高 级 方式 创建 标签 页 的 话 , 会 创建 一 个 具有 与 概览 标签 页 相 类 似 的 、 包 含 了 基本 代 
码 的 类 文件 ， 以 不 同 的 方式 展示 3 种 不 同 的 属性 。 
通过 简单 的 编码 即 可 完成 标签 页 的 配置 工作 , 使 用 扩展 点 也 只 需要 处 理子 类 org .eclipse. 
ui .forms .eaqitor.FormPage， 无 须 依赖 于 JRockit  JRockit Mission Control 的 某 个 类 。 编 辑 
器 输入 内 容 会 被 适 配 为 IMBeanService, 用 于 与 com. jrockit.mc.rjmx.core 包 中 的 控制 台 
通信 。 

private IMBeanService getMBeanService() { 


return (IMBeanService) 
getEditorInput ().getAdapter (IMBeanService.class) ; 
















































































} 

这 样 , 对 JRockit Mission Control 的 访问 就 可 以 被 指定 到 位 于 com.jrockit .mc.rjmx* 插 件 
中 的 MBean 层 。 除 此 之 外 ，RJMX 还 提供 了 对 JRockit Mission Control 中 的 订阅 引擎 和 代理 层 的 
访问 功能 。 

代理 层 可 通过 标准 的 API 访 问 JRockit 中 的 属性 和 操作 ， 无 须 顾虑 版 本 之 间 的 差别 ， 例 如 使 
用 getMBeanService() .getProxyNames () 来 访问 属性 ， 使 用 getMBeanService() .getProxy- 
operations () 来 访问 操作 。 

例如 , 访问 CPU 负载 的 属性 在 JRockit 的 R26.4，R27.x 和 R28x 中 都 各 不 相同 ,为 了 能 够 无 
差别 地 访问 CPU 负载 这 个 属性 ， 可 以 通过 代理 层 来 实现 ， 如 下 所 示 : 

getMBeanService().getProxyNames(). 

getAttributeDescriptor (IProxyNames.Key.OS_CPU_LOAD) ; 


上 面 的 代码 会 返回 一 个 包含 了 MBean 对 象 ObjectName 和 属性 名 的 属性 描述 符 〈 attribute 
descriptor )。 大 部 分 RJMX 所 使 用 的 属性 描述 符 都 是 对 MBean 对 象 的 objectName 和 属性 名 的 


封装 。 
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下 面 的 代码 展示 了 如 何在 R28 版 本 中 创建 一 个 指向 CPU 负载 属性 的 属性 描述 符 。 


new AttributeDescriptor ( 
"oracle. jrockit .management:type=Runtime","CPULoad") ; 


看 想 在 多 个 Rockit 版 本 之 间 ， 无 差别 地 调用 垃圾 回收 操作 ， 可 以 通过 以 下 方式 完成 : 
getMBeanService().getProxyOperations().gc(); 
正如 在 高 级 模板 的 代码 所 见 ， 添 加 一 个 包含 了 多 个 属性 的 表格 其 实 非 常 简单 。 


builder.setProperty( 
AttributeVisualizerBuilder.TITLE, "Chart"); 

builder.setProperty ( 
AttributeVisualizerBuilder.TITLE_AXIS_Y, "%"); 

builder.setProperty ( 
AttributeVisualizerBuilder.TITLE_AXIS_X, "Time"); 
addAttributesToVisualizer(builder.createChart ()); 


实际 上 , 简单 模板 的 代码 并 不 像 看 起 来 那么 容易 ， 因 为 它 直 接 使 用 了 不 同 的 服务 ,而 不 依赖 
于 标准 的 Mission Control GUI 组 件 ， 不 过 正 因 如 此 ，GUI 的 实现 也 更 简单 一 些 。 使 用 简单 模板 生 
成 的 标签 页 很 好 地 展示 了 如 何 使 用 RJMX 订阅 服务 。 客 户 端 可 以 使 用 与 控制 台 其 他 部 分 相同 的 订 
阅 机 制订 阅 一 个 或 多 个 属性 值 的 变动 情况 , 通过 subscriptionService 类 即 可 完成 对 CPU fA 
载 属性 值 的 订阅 。 
getMBeanService().getAttributeSubscriptionService() 
.addAttributeValueListener (getMBeanService().getProxyNames(). 


getAttributeDescriptor (IProxyNames.Key.OS_CPU_LOAD) , 
new LabelUpdater (valueLabel)); 









































LabelUpdater 类 是 对 com. jrockit.mc.rjmx.subscription. IAttributeValueListener 
接口 的 简单 实现 。 每 次 获取 新 属性 值 的 时 候 ， 都 会 调用 valuechanged 方法 ， 并 附带 一 个 包含 
了 属性 值 的 事件 对 象 。 注 意 ， 这 里 并 不 能 保证 是 哪个 线程 发 起 了 事件 , 在 目前 的 实现 中 ,可 能 是 
订阅 线程 ， 也 可 能 是 JMX 某 个 子 系统 的 线程 。 一 般 情况 下 ， 绝 不 会 是 GUI 线程 发 起 了 事件 ， 更 
新 GUI 的 工作 会 交 给 专门 的 GUI 线程 完成 ， 正 如 下 面 的 代码 所 示 ， 会 调用 DisplayToolkit. 
safeAsyncExce 方法 来 完成 更 新 。 

public static class LabelUpdater 


implements IAttributeValueListener { 
private final Label label; 









































public LabelUpdater (Label label) { 
this.label = label; 
} 


public void valueChanged(final AttributeValueEvent event) { 
DisplayToolkit.safeAsyncExec(label, new Runnable() { 
public void run() { 
Double latestValue = (Double) event.getValue(); 
label.setText ("CPU Load is: " 
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+ (latestValue.doubleValue() * 100) + "%"); 


AE 
} 
} 


为 触发 器 动作 创建 扩展 也 是 一 样 的 道理 ， 在 第 6 步 中 ， 选 择 Mission Control Trigger Action 
Wizard 即 可 。 

















7.4 小结 


本 章 介绍 了 如 何 使 用 Management Console 来 监控 运行 在 JRockit 中 的 应 用 程序 ， 并 通过 示例 
讲述 了 JRockit Management Console 中 不 同 标签 页 所 具有 的 功能 。 

此 外 ， 还 介绍 了 如 何 扩展 Management Console， 以 及 如 何 自 定义 触发 器 规则 和 动作 。 

下 一 章 将 会 介绍 如 何 使 用 JRockit Runtime Analyzer 对 JRockit 及 运行 在 其 中 的 应 用 程序 进行 
诊断 和 分 析 。 














JRockit Runtime Analyzer 














JRockit Runtime Analyzer, 简称 JRA, 是 JRockit 专 有 的 性 能 分 析 工 具 , 可 以 提供 有 关 JRockit 
以 及 运行 在 其 中 的 应 用 程序 的 运行 时 信息 。 在 JRockit R27 及 之 前 版 本 中 ，JRA 是 进行 性 能 分 析 
的 主要 工具 ， 直 到 JRockit Flight Recorder 出 现 并 取代 之 。 由 于 IRA 的 运行 时 开销 非常 小 ， 所 以 
可 以 应 用 于 生产 环境 中 。 
本 章 的 主要 内 容 包 括 : 
口 如 何 创 建 IRA 记录 
何 找到 应 用 程序 的 热点 
何 解 读 IRA 中 与 内 存 相关 的 数据 
口 如 何 解决 应 用 程序 中 的 延迟 问题 
fi 
fi 





















































可 探查 应 用 程序 中 的 内 存 泄 漏 问 题 
可 使 用 JRA 延迟 分 析 组 件 中 的 操作 集合 

















本 章 主要 以 JRockit R27.x 和 Mission Control 3.x 为 基础 进行 介绍 。 第 9 章 将 

以 JRockit R28/4.0 为 基础 介绍 如 何 使 用 JRockit Flight Recorder 进行 性 能 分 析 。 A 
> 为 R27x 版 本 中 用 于 记录 分 析 的 组 件 与 R28 版 本 中 的 相似 ,所 以 本 章 会 一 同 介 绍 。 

下 一 章 将 会 介绍 一 些 其 他 组 件 ， 以 及 R27.x/3.x 和 R28/4.0 之 间 最 重要 的 区 别 。 


8.1 反馈 信息 的 必要 性 


JRockit 成 为 业界 领先 的 JVM， 离 不 开 用 户 的 大 力 协 助 。JRockit 致力 于 提升 服务 器 端 应 用 程 
序 的 性 能 和 扩展 性 ， 最 密切 的 协作 往往 来 自 于 部 署 了 大 量 服务 器 的 用 户 ， 例 如 金融 行业 的 用 户 。 
JRA 最 初 是 为 了 收集 JRockit 的 性 能 信息 而 开发 的 。 

其 实 ， 用 户 并 不 太 愿 意 将 其 应 用 程序 相关 的 敏感 数据 发 给 JRockit 开发 团队 ， 当 然 更 不 会 让 
JRockit 开发 团队 在 其 生产 环境 中 做 性 能 分 析 ， 因 为 用 户 应 用 程序 每 周 所 处 理 的 资金 流水 可 能 高 
达 数 十 亿美 元 。 故 而 ， 就 需要 一 种 工具 来 帮助 收集 JRockit 和 其 中 的 应 用 程序 的 运行 情况 ， 这 样 
既 有 助 于 改进 JRockit， 还 可 以 发 现 用 户 应 用 程序 有 哪些 异常 行为 。 当 然 ， 实 现 这 个 工具 会 有 一 
些 挑战 。 想 找到 系统 的 性 能 瓶颈 ， 就 需要 准确 地 测量 系统 的 各 个 参数 ， 此 外 ,还 要 尽 可 能 降低 工 
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具 的 执行 开销 。 如 果 工 具 本 身 会 产生 较 大 的 执行 开销 ,也 就 无 法 获知 系统 的 真实 运行 情况 , 用户 
由 肯定 不 会 在 生产 环境 中 使 用 这 个 工具 。 

作为 一 款 记录 应 用 程序 运行 时 信息 的 工具 , JRA 使 用 起 来 非常 方便 , 而且 能 够 提供 足够 多 的 
言 息 来 优化 Rockit。 如 今 ，JRA 已 经 作为 一 种 问题 诊断 和 性 能 调 优 工具 ， 被 用 户 广 泛 使 用 。 

起 初 ，JRA 使 用 XML 文档 来 记录 运行 时 信息 ， 这 样 既 方 便 开发 人 员 调 试 ， 也 可 以 让 用 户 知晓 
具体 有 哪些 信息 被 记录 了 下 来 。 后 来 ，JRockit 的 开发 人 员 调 整 了 记录 信息 的 内 容 ， 加 入 了 与 系统 
延迟 相关 的 数据 ， 于 是 IRA 记录 的 数据 就 被 分 成 了 两 部 分 ， 分别 是 具备 可 读 性 的 XML 文件 和 记 
录 了 延迟 事件 的 二 进 制 数据 。 在 记录 运行 时 信息 的 过 程 中 , 延迟 信息 存储 在 JRockit 的 内 存 缓冲 区 
中 ， 同 时 ， 为 了 避免 引入 额外 的 延迟 和 性 能 损耗 ， 延 迟 信息 是 直接 从 内 存 缓冲 区 写 人 到 磁盘 的 。 

因此 ，JRA 生成 的 文件 有 两 种 类 型 ，. jra 和 .jfr， 分别 对 应 于 JRockit R28 之 前 和 之 后 的 
不 同 版 本 。 在 JRockit R28 版 本 之 前 ，JRA 输出 的 文件 中 主要 是 没有 关联 数据 模型 的 XML 文档 ， 
到 了 R28 版 本 之 后 , 记录 文件 中 保存 了 关联 着 事件 模型 的 二 进 制 数据 , 更 便于 使 用 分 析 工 具 进行 
性 能 分 析 。 

若 想 打 开 IRA 的 记录 文件 ， 必 须要 使 用 JRockit Mission Control 3.x 版 本 ; 若 要 打开 JFR Wid 
录 文 件 ， 则 要 使 用 TRockit Mission Control 4.0 及 以 上 的 版 本 。 


记录 


通过 以 下 几 种 方法 可 以 控制 开启 、 结 束 对 运行 时 信息 的 记录 。 
口 使 用 IRCMD 命令 行 工具 。 更 多 有 关 JRCMD 的 内 容 ， 请 参见 第 11 章 的 介绍 。 
O 使 用 JVM 命令 行 参数 。 这 方面 更 多 的 内 容 , 请 参见 JRockit 文档 中 有 关 -xxjra 参数 的 描述 。 
口 使 用 JRockit Mission Control 套件 中 的 JRA 图 形 化 工具 。 
当然 ， 最 简单 的 方法 还 是 在 JRockit Mission Control GUI 中 通过 JRA/JFR 的 提示 窗口 完成 对 
记录 信息 的 控制 。 在 JVM 浏览 器 展示 区 中 选择 目标 JVM 后 , 点 击 工具 栏 中 的 JRA 按钮 即 可 , 或 
者 在 上 下 文 菜单 中 开启 JRA 记录 。 通 常情 况 下 ,使 用 预定 义 的 配置 即 可 ， 如 有 特殊 需要 的 话 ， 
可 以 根据 实际 需要 灵活 调整 。 在 JRockit Mission Control 3.x 版 本 中 ， 预 定义 的 模板 如 下 所 示 。 
Q Full Recording: 标准 用 例 ， 默 认 情 况 下 会 记录 大 部 分 相关 数据 ， 时 长 为 $ 分 钟 。 
D Minimal Overhead Recording: 该 模板 主要 应 用 于 对 系统 延迟 非常 敏感 的 应 用 程序 ， 例 
如 ， 它 不 会 记录 堆 的 统计 数据 ， 因 为 这 些 数据 会 引发 额外 的 垃圾 回收 操作 。 
O Real Time Recording: 当 要 追查 系统 延迟 问题 时 , 例如 对 运行 在 JRockitRealTime 上 的 应 
用 程序 进行 调 优 时 ， 该 模板 会 非常 有 用 。 该 模板 提供 了 额外 的 文本 输入 框 来 设置 系统 延 
迟 的 阅 值 (后续 会 对 此 值 做 详细 介绍 )。 在 此 种 类 型 下 ， 默 认 的 延迟 阔 值 会 从 20 毫秒 降 
低 为 5 毫秒， 而 且 记 录 时 间 也 比 默 认 值 短 。 
Q Classic Recording: 值得 注意 的 是 ， 在 此 种 类 型 下 ， 记 录 信 息 中 并 不 包含 任何 与 系统 延 
述 相关 的 数据 。 如 果 耻 ockit 是 R27.3 之 前 的 版 本 ， 又 或 者 对 延迟 数据 不 感 兴趣 的 话 ， 可 
以 使 用 此 种 类 型 。 
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点 击 Show advanced options 复 选 框 ， 可 以 对 模板 做 定制 化 配置 。 一 般 来 说 ， 这 并 非 必 须 。 

下 面 简单 介绍 其 中 的 一 些 选 项 。 

口 Enable GC sampling: 该 选项 控制 是 否 记 录 与 GC 相关 的 信息 。 如 果 明 确 了 对 GC 信息 不 

感 兴趣 的 话 ， 将 之 关闭 即 可 。 该 选项 默认 打开 ， 建 议 保留 。 

D Enable method sampling: 该 选项 用 于 控制 是 否 启用 方法 采样 。 方 法 采样 是 通过 JRockit 
的 代码 优化 组 件 的 采样 数据 实现 的 。 如 果 应 用 程序 对 系统 性 能 有 较 高 的 要 求 ， 那 么 要 谨 
慎 设 置 方法 采样 的 周期 。 

口 Enable native sampling: 该 选项 用 于 控制 是 否 在 做 方法 采样 时 收集 执行 本 地 代码 所 花费 
的 时 间 。 大 部 分 情况 下 ， 只 有 JRockit 开发 人 员 和 支持 人 员 会 关心 此 项 数据 ， 因 此 默认 情 
况 下 不 开启 此 选项 。 

口 Hardware method sampling: 在 某 些 硬件 架构 上 ，CPU 中 包含 了 特殊 的 硬件 计数 器 ， 在 
此 基础 上 ，JRockit 可 以 更 好 地 完成 方法 采样 的 工作 。 因 此 ， 只 有 在 这 些 硬件 架构 上 ， 该 
选项 才 真正 有 用 。 有 关 基 于 硬件 进行 采样 的 内 容 ， 请 参见 第 2 章 的 介绍 。 

O Stack traces: 开启 该 选项 不 仅 可 以 从 方法 采样 中 获知 采样 次 数 , 还 可 以 得 到 调用 栈 信息 。 

如 果 关 闭 此 选项 的 话 ， 在 热 方法 列表 中 ， 就 不 会 包含 采样 点 的 调用 信息 了 。 

O Trace depth: 该 选项 指定 了 获取 调用 栈 信息 时 所 要 进入 的 深度 。 在 JRockit Mission Control 
4.0 版 本 之 前 ,该 选项 的 默认 值 是 16。 对 于 那些 使 用 了 大 型 编程 框架 的 应 用 程序 来 说 ， 这 
个 设 定 值 太 小 ， 完 全 没有 意义 。 一 般 来 说 ， 设 定 在 30 以 上 ， 才 能 有 所 帮助 。 

口 Method sample interval: 该 选项 指定 了 两 次 线程 采样 之 间 的 时 间 间 隔 。 在 两 次 采样 的 时 
间 间 隔 之 内 ，JRockit 会 以 Round-Robin 的 方式 暂停 一 部 分 线程 的 执行 ， 而 采样 只 会 发 生 
在 正在 运行 的 线程 上 。 这 样 就 可 以 找 出 应 用 程序 的 计算 量 主要 发 生 在 哪里 。 更 多 详细 内 
容 请 参见 8.2.3 节 。 

口 Thread dumps: 开启 该 选项 后 ，JRockit 会 在 开始 和 结束 时 记录 线程 栈 的 调用 信息 。 如 果 

设置 了 线程 转 储 的 时 间 间 隔 ， 则 在 记录 的 过 程 中 ， 还 会 每 隔 一 段 时 间 就 做 一 次 线程 转 储 。 

口 Thread dump interval: 该 选项 用 于 控制 两 次 线程 转 储 的 时 间 间 隔 。 

口 Latencies: 开启 该 选项 后 ，JRA 会 记录 一 些 与 延迟 相关 的 信息 。 更 多 有 关 延 迟 的 内 容 ， 

请 参见 8.2.5 节 。 

D Latency threshold: 在 设置 该 选项 值 后 ,JRA 只 会 记录 延迟 时 间 大 于 该 阔 值 的 时 间 。 一 般 
情况 下 ， 会 将 该 选项 值 设置 为 20 毫秒 ， 即 便 是 设置 为 1 毫秒 也 不 会 有 太 大 问题 。 但 如 果 
设置 得 太 小 ， 就 会 产生 较 大 的 运行 时 开销 ， 而 且 产 生 的 日 志 量 也 会 大 得 惊人 。 修 改 该 参 
数值 时 ， 可 以 以 纳 秒 为 单位 进行 设置 ， 在 时 间 单 位 复 选 框 中 选择 目标 单位 即 可 。 

a Enable CPU sampling: 开启 该 选项 后 ，JRockit 会 定时 记录 下 CPU 负载 信息 。 

口 Heap statistics: 开启 该 选项 后 ，JRockit 会 在 开始 和 结束 时 各 做 一 次 堆 内 存 分 析 。 由 于 执 
行 堆 内 存 分 析 需 要 额外 执行 一 次 垃圾 回收 来 收集 相关 信息 ， 因 此 在 需要 低 执行 开销 的 模 
板 中 该 选项 是 禁用 的 。 
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Q Delay before starting a recording: 使 用 该 选项 可 以 使 JRA 在 应 用 程序 运行 一 段 时 间 后 再 
开始 记录 。 延 迟 时 间 的 设 定 通常 以 分 钟 为 单位 ， 用 户 也 可 以 自行 选择 相应 的 时 间 单 位 ， 
支持 从 秒 到 天 的 设置 。 

在 执行 记录 之 前 ， 要 先 指 定 记 录 文 件 会 存放 在 哪里 。 当 JRA 开始 记录 后 ,会 打开 一 个 编辑 

器 显示 相关 的 配置 选项 和 进度 条 。 在 记录 结束 后 ， 会 显示 记录 的 具体 内 容 。 















































8.2 分 析 JRA 记录 


分 析 JRA 的 记录 信息 看 起 来 像 是 在 表演 黑 魔 法 ， 因 此 本 章 会 像 第 7 章 一 样 ， 详 细 介绍 JRA 
编辑 器 中 的 每 个 标签 页 。 
与 Management Console 类 似 ， 这 里 也 涉及 几 种 标签 组 。 















































8.2.1 一 般 信息 标签 


一 般 信息 标签 组 中 提供 了 一 些 关 键 信息 和 元 数据 。 在 JRA 中 ， 它 包含 了 3 个 标签 页 ， 分别 
是 概览 、 记 录 和 系统 。 

1. 概览 标签 页 

一 般 信息 标签 组 的 概览 标签 页 中 包含 了 一 些 与 IRA 记录 相关 的 关键 信息 ， 可 以 从 宏观 上 看 
出 系统 是 否 运转 正常 。 

标签 页 的 第 一 部 分 是 几 个 面板 , 在 其 中 显示 了 CPU 使 用 率 、 堆 内 存 和 和 暂停 时 间 等 统计 信息 。 

理想 情况 下 , 系统 资源 应 该 被 充分 利用 ， 但 负载 又 不 会 太 过 饱和 。 一 般 来 说 , Occupied Heap 






































(live set+ fragmentation ) 的 数值 应 该 小 于 等 于 堆 最 大 值 的 一 半 ， 这样 可 以 使 垃圾 回收 的 执行 频率 Bo 


保持 在 较 低 的 水 平 。 

当然 , 具体 数值 还 是 要 根据 应 用 程序 自身 的 特点 量 身 而 定 。 对 于 那些 内 存 分 配 速率 很 低 的 应 
用 程序 来 说 , Occupied Head 的 值 即 使 大 一 些 也 没关系 。 而 对 那些 执 和 ee 用 程序 来 
说 ， 更 关注 系统 的 吞吐 量 、 是 否 充 分 利用 了 CPU 资源 ， 至 于 暂停 时 间 ， 可 能 根本 不 关心 。 

Trends 展示 区 中 以 趋势 图 的 形式 展示 了 CPU ee a 在 旁边 是 一 个 饼 
状 图 ， 展 示 了 记录 结束 时 堆 的 使 用 情况 。 如 果 堆 中 有 超过 1/3 的 区 域 已 经 碎片 化 了 ， 那 么 这 时 候 
就 应 该 考虑 调整 Rockit 的 垃圾 回收 器 (参见 第 5 章 ), 并 且 也 应 该 深入 探究 一 下 应 用 程序 的 内 存 
分 配 行为 (更 多 信息 请 参见 8.2.2 T) z 

在 该 标签 页 的 底部 是 一 个 综述 信息 ， 例 如 目标 JVM 的 版 本 信息 和 记录 时 间 等 。 在 给 JRockit 
支持 团队 提交 支持 工 单 时 ， BATI a EAEI. 

在 示例 图 中 可 以 看 出 ，Live Set + Fragmentation 的 数值 呈 持 续 增长 态势 ， 这 说 明 在 每 次 垃 
圾 回收 过 后 , 堆 中 可 用 内 存 都 变 得 更 少 了 , 通常 来 说 , 这 意味 着 应 用 程序 很 可 能 发 生 了 内 存 泄漏 。 
如 果 继 续 下 去 ， 应 用 程序 会 因 outofMemoryError 错误 而 中 断 运 行 。 
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2. 记录 标签 页 

该 标签 页 中 包含 了 与 记录 本 身 相关 的 一 些 元 数据 , 例如 记录 的 持续 时 间 , 各 个 记录 参数 的 值 
等 。 这 些 信息 可 用 于 检查 JRA 记录 是 否 是 按 预想 的 设 定 的 ， 或 者 某 部 分 数据 是 否 因 为 被 禁用 而 
没有 记录 。 

3. 系统 标签 页 

该 标签 页 中 包含 了 目标 JRockit JVM 的 一 些 系统 信息 ， 如 操作 系统 和 JVM 启动 参数 等 。 









































8.2.2 内存 标签 组 


Memory 标签 组 中 包含 了 与 内 存 信息 相关 的 内 容 ， 例 如 内 存 使 用 率 ， 垃 圾 回收 信息 
JRA 中 ， 其 共有 6 个 子 标签 页 ， 分 别 是 概览 、 垃 圾 回收 、 垃 圾 回收 统计 、 内 存 分 配 、 堆 信息 e 
对 象 统计 。 

1. 概览 标签 页 

概览 标签 页 中 包含 了 一 些 与 内 存 相 关 的 综述 性 信息 , 例如 目标 服务 器 当前 可 用 物理 内 容 的 数 
He, GC 暂停 比率 (BI GC 暂停 时 间 占 应 用 程序 运行 总 时 间 的 百分比 ) 等 。 

如 果 GC 暂停 比率 达到 了 15% ~ 20%， 这 通常 意味 着 JVM 有 很 大 的 内 存 压力 。 

在 概览 标签 页 的 底部 , 列 出 了 在 记录 过 程 中 所 用 到 的 垃圾 回收 策略 。 更 多 有 关 垃 圾 回收 策略 
的 内 容 ， 请 参见 第 3 章 的 介绍 。 

2. 垃圾 回收 标签 页 

垃圾 回收 标签 页 中 包含 了 记录 期 间 与 垃圾 回收 相关 的 信息 。 

mae aie 1 Collections 表 中 ， 按 Long Pause 字段 倒序 排列 可 以 更 好 地 看 出 垃 
圾 回收 的 性 能 瓶颈 。 当 然 , 通过 IRA 中 其 他 标签 的 内 容 , 或 应 用 程序 的 GC 日 志 也 可 以 获得 相同 
信息 

有 时 IR, 在 分 析 垃 圾 回收 的 记录 时 , 会 去 除 第 一 次 和 最 后 一 次 垃圾 回收 记录 , 因此 某 些 JVM 
参数 配置 会 强制 记录 过 程 中 的 第 一 次 和 最 后 一 次 垃圾 回收 必须 为 FullGC, 并 执行 内 存 整 理 操作 ， 
以 便 收集 相关 数据 ,这 种 机 制 可 能 会 破坏 准确 垃圾 回收 的 暂停 时 间 目 标 , 在 JRockit Flight Recorder 
中 同样 存在 这 种 情况 。 

如 果 某 个 应 用 程序 因 垃 圾 回收 而 导致 暂停 的 频率 很 高 ， 则 其 Occupied Heap 的 值 会 很 接近 
堆 的 最 大 值 。 因 此 ， 增 大 堆 的 最 大 值 可 以 有 效 提升 应 用 程序 的 整体 性 能 。 使 用 命令 行 参数 -xmx 
即 可 设置 堆 的 最 大 的 值 。 

在 Details 展示 区 中 ,使 用 了 多 个 标签 页 来 显示 垃圾 回收 的 具体 信息 。 用 户 可 以 通过 点 击 垃 
圾 回收 信息 图 或 在 数据 表 中 选择 具体 条 目 来 查看 详细 信息 

垃圾 回收 的 具体 信息 包括 引用 队列 的 大 小 、 me. 此 外 ,还 包括 垃圾 回收 前 后 堆 的 详 
细 使 用 信息 ， 引 发 垃圾 回收 操作 的 调用 栈 信 息 ， 甚 至 是 每 次 暂停 的 详细 信息 。 

若 想 减 少 垃圾 回收 的 次 数 ,前 aao 原因 导致 了 垃圾 回收 的 发 生 , 具体 来 说 
就 是 ， 创 建 对 象 的 操作 都 发 生 在 哪里 。 下 一 节 中 将 会 介绍 的 GC Call Tree 可 用 于 探查 对 象 创建 的 
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操作 。 如 果 要 获取 有 关内 存 分 配 更 详细 的 信息 , 可 以 在 Latency 标签 组 中 , 查看 与 Object Allocation 
事件 有 关 的 内 容 。 

对 于 某 些 应 用 程序 来 说 ， 还 可 以 通过 调整 JRockit 的 内 存 系统 来 降低 垃圾 回收 的 暂停 时 间 。 
更 多 有 关 JRockit 调 优 的 内 容 ， 请 参见 第 5 章 的 介绍 。 

3. 垃圾 回收 统计 标签 页 

该 标签 页 中 包含 了 与 垃圾 回收 相关 的 一 些 统计 信息 ， 其 中 最 重要 的 当 属 GC Call Tree 表 中 
的 内 容 ， 从 中 可 以 看 到 每 次 垃圾 回收 的 调用 栈 信息 。 但 遗憾 的 是 ， 在 调用 栈 中 也 存在 着 一 些 
JRockit 内 部 代码 ， 用 户 不 得 不 继续 深 控 ， 才 能 找到 应 用 程序 自身 的 方法 调用 。 














在 JRockit R27.6 版 本 之 前 ， 通 常 使 用 这 种 方法 找 出 内 存 分 配 问题 的 根源 ， 
而 在 新 近 的 版 本 中 ， 则 可 以 使 用 更 加 强 有 力 的 武器 来 查找 内 存 性 能 问题 ， 参 见 
8.2.5 节 直 方 图 标签 页 的 介绍 。 


为 节约 篇 幅 , 在 下 面 的 截图 中 ， 只 扩展 了 JRockit 内 部 方法 的 调用 栈 帧 。 从 截图 中 可 以 看 出 ， 
大 部 分 垃圾 回收 都 是 用 于 调用 了 Arrays .copyof (char[] ，int) 方 法 导致 的 。 


3 example 6 - inspect on e request - widf-lat-servlet_R28,jra 53 A 





























@ GC Statistics 加 
GC Statistics ®© 
Old Collection Young Collection All Collections 
GC count 5 5 10 
Average GC time 100,800 ms 27,800 ms 64,300 ms 
Average time between GC 5 s 800,000 ms 5 s 800,000 ms 2 s 900,000 ms 
GCs with a call trace 5 5 10 
Pause count 5 5 10 
Average pause time 101,288 ms 7 28,138 ms = > j 64,713 ms 7 
Total pause time 506,441 ms 140,690 ms 647,131 ms 
GC Call Trees B® 
All call traces sampled during garbage collection 
a [J 100,00% [10] Garbage Collection a 


4 ® 50,00% jrockit.vm.Allocator.allocLargeObjectOrArray(int, int, boolean) 
4 ® 50,00% jrockit.vm.Allocator.allocObjectOrArray(int, int, int, boolean) 
4 ® 50,00% jrockit.vm.Allocator.allocArray(int, int, boolean) 
D % 20,00% java.util.Arrays.copyOf(char[], ipt) 
D R TREET ET erae 
5 % 10,00% weblogic.utils.classloaders.ZipSource.getBytes() 
D ® 10,00% java.util.zip.InflaterinputStream.<init> (InputStream, Inflater, int) 
4 ® 30,00% jrockit.vm.Allocator.nativeGetNewTLA(int, int) 
4 ® 30,00% jrockit.vm.Allocator.allocObjectOrArray(int, int, int, boolean) 
4 ® 20,00% jrockit.vm.Allocator.allocObject(int) 
© % 10,00% java.util. HashMap.addEntry(int, Object, Object, int) 
© % 10,00% java.util zip.ZipFile$2.nextElement0, 
a ® 10,00% jrockit.vm.Allocator.allocArray(int, int, boolean) 
% 10,00% java.util Arrays.copyOfRange(char[], int, int) 
4 ® 20,00% java.util.zip.ZipEntry.initFields(int) 
4 ® 20,00% java.util.zip.ZipEntry.<init> (int) 
4% 20 00% iava.util.7in.7inFile$?.nextFlement) 


® Overview |) GCs | J GC Statistics | % Allocation | 他 Heap Contents| Gy Object Statistics 
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4. 内 存 分 配 标签 页 

内 存 分 配 标签 页 中 包含 的 信息 主要 用 于 对 JRockit 内 存 系 统 进行 调 优 。 在 这 里 会 显示 出 大 对 
象 和 小 对 象 的 相对 分 配 速率 ， 其 值 会 影响 到 对 TLA 大 小 的 选择 (APSE TLA 的 内 容 请 参见 第 3 章 
和 第 5 章 )。 此 外 ， 还 可 以 以 线程 为 单位 查看 内 存 分 配 的 相关 数据 ， 这 样 更 有 助 于 发 现 调 优 从 哪 
里 开始 ,减轻 应 用 程序 本 身 在 内 存 使 用 上 的 压力 。 

当然 , 调 优 Java 应 用 程序 的 内 存 分 配 行为 , 最 好 还 是 要 参考 Latency 标签 组 中 的 Histogram 
标签 页 中 的 数据 。 

5. 堆 信 息 标签 页 

在 堆 信息 标签 页 中 包括 了 有 关 推 中 对 象 排 布 的 信息 ， 在 记录 结束 时 会 生成 相关 的 快照 信息 。 
如 果 发 现 堆 的 碎片 化 程度 较 高 ， 那 么 有 两 个 选择 ， 要 么 调 优 下 ockit 的 垃圾 回收 机 制 ， 要 么 尝试 
修改 应 用 程序 的 内 存 分 配 行为 。 正 如 第 3 章 所 述 ，JVM 会 通过 内 存 整理 来 降低 堆 的 碎片 化 程度 。 
在 极端 情况 下 ， 如 果 对 系统 性 能 有 很 高 要 求 、 分 配 压力 大 ， 就 需要 调整 应 用 程序 的 内 存 分 配 模式 
才能 达到 预期 目标 。 

6. 对 象 统计 标签 页 

对 象 统计 标签 页 以 直方 图 的 形式 展示 在 记录 开始 和 结束 时 的 对 象 分 布 情况 , 在 这 里 可 以 看 到 
中 对 象 的 类 型 及 其 所 占用 的 内 存 空间 。 如 果 记 录 开 始 和 结束 时 ， 对 象 分 布 情况 差距 过 大 ， 这 说 
明 ， 要 么 应 用 程序 发 生 了 内 存 泄漏 ， 要 么 是 应 用 程序 正在 执行 需要 分 配 大 量 内 存 的 操作 。 

若 想 找到 对 象 是 在 哪里 创建 的 ， 最 好 的 办 法 就 是 查看 目标 对 象 的 Object Allocation 事 
件 (参考 8.2.5 节 直 方 图 标签 页 的 内 容 )， 或 者 在 Memory Leak Detector 中 查询 内 存 分 配 的 分 
析 结 果 。 在 第 10 章 中 会 详细 介绍 Memory Leak Detector。 


8.2.3 代码 标签 组 


代码 标签 组 中 包含 了 以 代码 生成 器 和 方法 采样 器 相关 的 信息 , 通过 概览 、 热 方法 和 优化 3 个 
标签 页 分 别 展示 。 

1. 概览 标签 页 

概览 标签 页 中 包含 了 从 代码 生成 器 和 优化 器 中 收集 到 的 采样 信息 , 通过 这 些 信息 可 以 找 出 哪 
些 方法 占用 了 应 用 程序 的 大 部 分 运行 时 间 。 收集 这 些 信 息 并 不 会 带 来 额外 的 性 能 损耗 ， 因 为 无 论 
如 何 代码 生成 系统 都 需要 用 到 这 些 信息 。 

对 于 那些 受 CPU 影响 较 大 的 应 用 程序 来 说 ， 通 过 该 标签 页 可 以 查找 出 应 用 程序 的 优化 点 。 
所 谓 “ 受 CPU 影响 较 大 的 应 用 程序 ”是 指 ， 对 应 用 程序 来 说 ，CPU 是 限制 因素 ,使 用 主 频 更 高 
的 CPU， 就 可 以 提升 应 用 程序 的 吞吐 量 。 

概览 标签 页 中 首先 展示 了 应 用 程序 在 记录 期 间 每 秒 所 抛 出 的 异常 的 数量 。 该 数值 的 大 小 取决 
于 硬件 和 应 用 程序 两 部 分 , 硬件 的 性 能 越 强 , 应 用 程序 的 执行 速度 越 快 , 抛 出 异常 的 数量 也 越 多 。 
当然 ,在 部 署 环 境 相 同 的 情况 下 ， 抛 出 的 异常 越 多 ,应 用 程序 的 运行 情况 越 糟 。 正 如 之 前 介绍 过 
的 ，JVM 通常 会 “ 赌 ” 异 常 不 会 频繁 发 生 。 如 果 应 用 程序 在 执行 过 程 中 大 量 抛 出 异常 ， 那 么 可 
能 会 大 大 降低 JVM 的 优化 效果 ， 这 时 就 需要 开发 人 员 仔细 探查 一 下 为 何 会 抛 出 如 此 多 的 异常 。 
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有 时 开发 人 员 会 使 用 异常 作为 控制 业务 流转 的 手段 , 或 者 可 能 是 因为 存在 有 配置 错误 而 不 断 抛 出 
异常 ， 但 不 论 是 哪 种 情况 ， 都 会 带 来 性 能 损耗 。 




















若 想 找 出 异常 的 抛 出 路 径 就 不 得 不 修改 日 志 的 记录 等 级 ( 参见 第 5 章 和 第 1 E. 


Æ JRockit Mission Control 3.1 中 ， 记 录 信 息 中 只 有 抛 出 a 和 信息 
的 内 容 ), 在 第 9 章 中 将 会 介绍 如 何 使 用 JRockit Flight Recorder 来 分 析 异 常 信息 。 





在 Hot Packages 和 Hot Classes 展示 区 中 ， 列 出 了 在 执行 过 程 中 ， 应 用 程序 到 底 把 时 间 花 
在 了 哪里 。 在 Hot Packages 展示 区 中 ， 热 方法 是 以 包 名 为 基础 排序 的 ， 而 在 Hot Classes 
区 中 ， 热 方法 是 类 名 为 基础 排序 的 。 若 想 获得 更 细 粒 度 的 信息 ， 则 需要 参考 Hot Method 标签 
中 的 数据 。 

2. 热 方法 标签 页 

该 标签 页 中 包含 了 与 JVM 代码 优化 器 有 关 的 详细 信息 。 如 果 想 要 找 出 应 用 程序 的 优化 点 ， 
不 妨 从 这 里 开始 。 若 存在 大 量 的 方法 采样 信息 都 源 自 于 同一 个 方法 , 则 优化 该 方法 ,或 者 减少 方 
法 调用 次 数 可 以 大 幅 提升 系统 的 整体 性 能 。 

在 下 面 的 示例 中 , 应 用 程序 大 部 分 时 间 都 在 执行 com.bea.wlrt .adapter.defaultprovider. 
inernal.CSVPacketReceiver.parserL2Packet () 方 法 ， 0 性 能 的 关 
键 ， 在 于 优化 应 用 程序 容器 (WebLogic event server )， 而 不 是 应 用 程序 本 身 。 这 个 示例 在 说 明 
JRockit Mission Control 功能 强大 的 同时 , 也 展示 了 性 能 优化 的 一 个 困境 ， e 能 瓶颈 ， 
也 不 一 定 能 搞定 优化 。 
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© ResultSetProcessorSimple.getSelectEventsHaving(Select... 1,20% % 4.02% java.util ArrayList add(Object) (OPT) 
© EPLProcessorProxy.onEventiList) 1.18% & 281% java.lang,System.nanoTime( 
bares © OutputProcessViewS!.continueOutputProcessing(boole.. 1,12% % 1,20% java.lang.String.trim0 (OPT) 
© String.equals(Object) 1,07% S 0,80% jrockit.vm.Allocator.nativeGetNewTLAQ 
© ReentrantReadWriteLock$NonfairSync.tryAcquireShared... 1,06% % 0,80% jrockit.vm.Allocator.getMoreMemoryAndAlloc(int, int, int, int, E 
© Streamimpl.onEventi(List) 1,04% ¥ 0,80% com.bea.wirt.ede.internal.EventGeneratorlmpl.createEventColle! 
Œ FilterParamindexEquals.matchEvent(EventBean, List) 1,02% 
© ZeroDepthStream.insert(EventBean) 1.02% ~ wh m » 
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有 时, 通过 监控 信息 可 以 发 现 应 用 程序 在 使 用 数据 结构 时 存在 的 问题 。 E PRESB 
用 程序 会 频繁 检查 java .util.LinkedList 实例 中 是 否 存储 了 目标 对 象 。 事 实 上 ， 
很 慢 的 ， 需 要 遍历 整个 列表 来 查找 元 素 ， 其 时 间 复 杂 度 为 O(n)。 很 明显 ， 如 果 改 用 Hashset 的 
话 , 可 以 加 速 查找 过 程 ( 如 果 哈 希 函 数 质 量 上 乘 , 而 且 集合 足够 大 的 , 其 平均 时 间 复 杂 度 为 0(1) )。 
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© Hot Methods OMe 
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3. 优化 标签 页 

该 标签 页 中 包含 了 与 JIT 编译 器 相关 的 各 类 统计 信息 ， 在 追查 JRockit 中 与 优化 相关 的 bug 
时 非常 有 用 。 相 关 信息 包括 优化 编译 所 消耗 的 时 间 ， 以 及 在 记录 开始 和 结束 花费 在 JIT 编译 上 的 
时 间 。 该 标签 页 会 将 记录 期 间 每 个 被 优化 过 的 方法 都 列 出 来 , 包括 优化 前 后 代码 体积 的 大 小 和 优 
化 所 消耗 的 时 间 。 


8.2.4 线程 / 锁 标 签 组 


在 线程 / 锁 标 签 组 中 可 以 查看 到 与 线程 和 锁 相 关 的 信息 ， 共 分 为 $ 个 标签 页 ， 分 别 是 概 
线程 、Java $i, JVM 锁 和 线程 转 储 。 

1. 概览 标签 页 

概览 标签 页 中 展示 了 线程 的 基础 信息 和 一 些 与 硬件 相关 的 信息 , 例如 系统 中 可 用 硬件 线程 的 
数量 和 每 秒 钟 上 下 文 切换 的 次 数 。 
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© Overview 
General Java Thread Count 


Hardware threads 4 Before sampling 





System total context switches/second 8981 Threads 15 


Threads started during recording 44 Daemon Threads | 14 


W Total CPU Usage  JRockit Process 


23:18 23:21 23:24 23:30 23:33 23:36 23:39 
Time (m:s) 


© 


E Thread Count 


oO 
23:12 23:15 23:18 23:21 23:24 23:27 23:30 23:33 23:36 23:39 








使 Overview| p® Threads 





从 上 图 中 可 以 看 出 ， 这 是 一 个 双核 CPU， 有 两 个 硬件 线程 ， 由 于 具有 超 线程 功能 ， 每 个 核 
心 会 可 以 模拟 出 1 个 额外 的 硬件 线程 ， 共 有 4 个 人 硬件 线程 。 

上 下 文 切换 频率 很 高 并 不 能 说 明 性 能 出 了 问题 , 而 如 果 线 程 同步 处 理 得 好 ,就 能 使 系统 获得 
更 高 的 知 吐 量 。 

上 图 中 展示 了 CPU 负载 ， 分 别 是 CPU 总 负载 和 消耗 在 JVM 上 的 负载 。 一 般 来 说 ，CPU i 
和 是 件 好 事 ， 说 明 充 分 利用 了 硬件 资源 ， 钱 没 白花 。 正 如 前 面 提 到 的 ， 对 于 那些 批 处 理应 用 程序 
来 说 ,CPU 工作 饱和 则 皆大欢喜 。 但 对 于 那些 服务 器 端 应 用 程序 来 说 , 如 果 系 统 在 完成 期 望 工作 
的 基础 上 ， 能 承受 更 高 的 负载 就 更 好 了 。 








硬件 服务 供应 问题 并 不 简单 , 但 正常 情况 下 , 服务 器 端 应 用 程序 都 应 该 有 一 些 

空闲 的 计算 能 力 应 对 瞬间 峰值 的 出 现 。 这 通常 被 称 为 过 度 供应 ( overprovisioning ), 

一 般 来 说 , 传统 上 只 涉及 购买 性 能 更 高 的 硬件 。 虚拟 化 技术 的 出 现 为 开发 人 员 解 
决 硬件 服务 供应 问题 提供 了 新 的 思路 。 在 第 13 章 会 介绍 这 部 分 内 容 。 


2. 线程 标签 页 

该 标签 页 中 显示 了 线程 相关 的 信息 表 ， 每 行 对 应 一 个 线程 。 默 认 情 况 下 ， 会 显示 启动 时 间 ， 
持续 时 间 和 Java 线程 ID ， 用 户 可 以 根据 实际 需要 通过 上 下 文 菜单 或 表 设置 按钮 来 设置 要 显示 的 
内 容 。 
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当 使 用 本 地 线程 时 ， 平 台 线 程 ID 是 由 操作 系统 指定 的 ， 在 使 用 操作 系统 相关 工具 来 探查 线 
程 信 息 时 会 用 到 平台 线程 ID。 

3. Java 锁 标 签 页 

该 标签 页 中 展示 了 在 记录 过 程 中 , Java 锁 的 使 用 情况 , 统计 信息 按照 监视 器 对 象 的 类 型 进行 
了 汇总 。 更 多 锁 的 相关 信息 ， 请 参见 第 4 章 的 内 容 。 

一 般 情 况 下 ， 该 标签 页 中 的 内 容 是 空 的 ， 需 要 在 启动 JRockit JVM 时 将 系统 属性 jrockit. 
lockprofiling 设置 为 true, 这 样 才 会 记录 锁 的 相关 信息 。 之 所 要 额外 设置 该 系统 属性 ， 
因为 锁 分 析 操 作 会 产生 额外 的 性 能 损耗 ， 当 系统 中 有 很 多 同步 操作 时 ， 尤 为 严重 。 
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随 着 对 JRockit 的 线程 模型 和 锁 模型 的 优化 ， 已 经 可 以 动态 启用 锁 分 析 了 ， 
SS 不 过 目前 还 未 发 布 使 用 。 从 R28 版 本 起 ， 已 经 使 用 命令 行 参数 -XX:UseLock- 
Profiling 代替 系统 属性 jrockit.lockprofiling 来 控制 是 否 启 用 锁 分 析 。 


4. JVM 锁 标签 页 
该 标签 页 展示 了 JVM 内 部 本 地 锁 相 关 的 信息 ， 一 般 来 说 ， 这 些 信息 对 JRockit JVM 开发 人 
和 支持 人 员 比 较 有 用 。 











在 第 4 章 中 曾 介 绍 过 本 地 锁 , 其 中 一 个 示例 就 是 代码 缓冲 区 锁 , 该 锁 由 JVM 
QS en, aretas 泽 后 的 代码 放 入 到 本 地 代码 缓冲 区 ,防止 多 个 代码 生成 线程 
之 间 互 相干 扰 。 
5. 线程 转 储 标签 页 
一 般 来 说 , IRA 记录 中 都 包含 了 记录 期 间 的 线程 转 储 信息 。 在 开始 记录 之 前 调整 转 储 的 间隔 
时 间 ， 可 以 控制 得 到 的 线程 转 储 信息 的 数量 。 




















8.2.5 延迟 标签 组 


延迟 分 析 工 具 是 随 着 JRockit Real Time — HH FLAY. JRockit Real Time 所 提供 的 可 预测 垃圾 
回收 暂停 时 间 的 特性 使 开发 人 员 吸 需 一 种 分 析 工 具 来 追踪 Java 应 用 程序 本 身 所 引入 的 延迟 问题 。 
如 果 应 用 程序 自身 会 导致 数 百 毫秒 延迟 的 话 ， 例 如 等 待 VO 时 ， 那么 即使 JVM 保证 将 垃圾 回收 
暂停 时 间 控 制 在 1 毫秒 内 也 没什么 实际 意义 了 。 

使 用 延迟 标签 组 的 标签 时 ， 强 烈 建议 在 菜单 栏 中 切换 到 延迟 透视 图 (latency perspective ). 
在 该 透视 图 中 ， 左 侧 是 事件 类 型 视图 (event type view ) 和 属性 视图 (properties view )。 事 件 类 型 
视图 可 用 于 选择 感 兴趣 的 延迟 事件 ， 而 在 属性 视图 会 显示 出 已 选择 的 延迟 事件 的 详细 信息 。 

与 垃圾 回收 标签 组 类 似 , 在 延迟 标签 组 顶部 也 有 一 个 范围 选择 器 ,允许 用 户 根据 实际 需要 只 
显示 某 一 部 分 记录 数据 。 修 改 所 选择 的 事件 或 范围 后 ， 会 及 时 在 标签 页 中 显示 出 更 新 后 的 数据 。 
范围 选择 器 中 的 曲线 为 红色 ,显示 了 在 某 个 时 间 点 上 发 生 的 事件 总 数 , 此 外 使 用 黑色 曲线 显示 现 
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在 同一 时 间 点 上 CPU 的 负载 。 使 用 范围 选择 器 的 上 下 文 菜单 可 以 指明 要 显示 哪些 具体 内 容 。 
在 处 理 延迟 问题 时 , 理解 操作 集 ( operative set ) 的 概念 非常 重要 , 它 是 指 在 延迟 标签 组 添加 、 
移 除 的 事件 集合 ， 可 以 将 之 理解 为 一 个 可 以 在 不 同 标签 页 之 间 共 享 ， 并 且 可 以 修改 的 事件 集合 。 
善 用 操作 集 可 以 获得 很 多 有 用 的 信息 。 
1. 概览 标签 页 
概览 标签 页 中 包含 了 一 些 与 延迟 事件 相关 的 汇总 信息 , 在 范围 选择 器 下 面 ,可 以 设 定 延 迟 的 
冰 值 ， 以 便 查看 延迟 时 间 超 过 某 个 阔 值 的 事件 。 由 于 延迟 事件 可 能 会 非常 多 ， 需 要 合理 设 定 延 迟 
阅 值 以 避免 记录 了 太 多 的 数据 。 默 认 情 况 下 ， 只 有 延迟 大 于 20 毫秒 的 事件 才 会 被 记录 下 来 。 









































延迟 事件 是 指 ，JVM 将 时 间 花 费 在 执行 Java 代码 之 外 的 事情 上 ， 并 且 所 用 
时 间 超过 了 菜 个 预 设 值 的 情况 。 例 如 ，JVM 可 能 需要 等 竺 大 接 字数 据 ， 或 者 因 
执行 垃圾 回收 而 暂停 了 应 用 程序 。 





事件 类 型 的 直方 图 和 人 饼 状 图 很 好 地 展示 了 每 个 事件 类 型 的 延迟 信息 , 可 以 方便 开发 人 员 查看 
记录 了 哪些 延迟 事件 。 值 得 注意 的 是 ,在 饼 状 图 中 , 记录 的 是 事件 的 发 生 次 数 ， 而 不 是 事件 所 持 
续 的 总 时 间 。 在 直方 图 中 , 通过 上 下 文 菜 单 将 指定 类 型 的 事件 添加 到 操作 和 集中, 会 在 范围 选择 器 
中 以 绿色 标识 出 来 ， 可 以 很 方便 地 找 出 指定 事件 的 发 生地 点 。 

这 里 还 有 一 个 小 技巧 ， 在 跟踪 视图 (trace view) 中 ， 点 击 Show only Operative Set 按钮 ， 
可 以 看 到 引发 指定 事件 类 型 的 调用 栈 信 息 。 

2. 日 志 标签 页 

在 日 志 标签 页 中 ， 以 表格 的 形式 列 出 了 所 有 的 事件 ,开发 人 员 可 以 对 其 过 滤 、 排 序 ， 筛 选 出 
所 需 的 结果 。 大 部 分 场景 下 ,会 按照 持续 时 间 排 序 ， 找 出 持续 时 间 最 长 的 延迟 事件 。 有 时 候 ， 持 
续 时 间 最 长 的 延迟 事件 可 能 是 因为 需要 等 待 从 套 接 字 接 收 数据 , 或 者 执行 了 持续 时 间 很 长 的 阻塞 
调用 ， 这 时 候 ， 就 可 以 在 操作 集 移 除 这 些 事件 ， 以 便 能 够 集中 精力 处 理 真 正 的 问题 。 

3. 图 形 标 签 页 

图 形 标签 页 中 以 线程 为 单位 展示 了 延迟 事件 相关 的 信息 ， 下 面 以 Java 和 垃圾 回收 器 事件 类 
型 为 例 说 明 相 关 信 息 。 在 每 个 线程 的 执行 过 程 中 ， 分 别 以 不 同 的 颜色 线条 表示 不 同 的 事件 类 型 。 
对 于 每 个 线程 来 说 , 在 任意 时 间 点 ， 只 会 有 一 个 事件 发 生 。 当 发 生 垃 圾 回收 事件 时 ， 会 显示 在 延 
迟 事件 图 的 顶部 ， 而 且 每 次 垃圾 回收 会 高 亮 显 示 以 区 别 于 其 他 线程 , 这 样 就 可 以 很 清晰 地 看 出 某 
个 延迟 事件 是 否 是 由 于 垃圾 回收 引起 的 。 绿 色 线 条 表示 ，JVM 正 欢 快 地 执行 Java 代码 ， 没 有 发 
生 延 迟 事 件 ， 其 他 颜色 表示 发 生 了 某 种 延迟 事件 。 将 鼠标 停留 在 颜色 线条 上 , 会 显示 出 其 所 代表 
的 含义 ， 如 下 图 所 示 。 

延迟 事件 图 也 会 显示 线程 转换 。 在 下 面 的 示例 图 中 , 各 个 线程 通过 一 个 静态 属性 域 来 共享 日 
TERA, 该 日 志 记 录 需 使 用 同步 操作 来 记录 日 志 数 据 。 从 示例 图 中 可 以 看 出 , 所 有 的 工作 线程 
都 在 等 待 获 取 共 享 资 源 。 工 作 线 程 以 并 行 的 方式 分 别 执行 一 部 分 任务 , 但 由 于 使 用 了 需要 同步 操 
作 的 共享 资源 ， 造 成 了 事实 上 的 串 行 执行 。 
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如 果 想 获得 更 多 详细 信息 ， 可 以 选择 图 形 中 的 某 个 事件 ,查看 其 具体 属性 , 将 鼠标 停 在 它 上 
面 读 取 弹 出 的 提示 ， 或 者 将 其 添加 到 操作 集中 以 便 在 其 他 视图 中 查看 。 

综 上 所 述 ， 通 过 网 形 标签 页 ， 可 以 获得 对 应 用 程序 的 延迟 和 线程 行为 的 总 体 印 象 。 

4. 线程 标签 页 

线程 标签 页 以 表格 的 形式 展示 了 当前 应 用 程序 中 所 存在 的 线程 , 从 形式 上 看 与 第 7 章 中 介绍 
的 Management Console 中 的 线程 标签 页 类 似 。 其 中 ， 最 有 用 的 往往 是 Count 和 Allocation Rate 
两 个 属性 。 

该 标签 页 主要 用 于 查找 指定 线程 ， 可 以 根据 某 个 属性 查找 ， 例 如 分 配 速率 (allocation rate ) 
最 高 ， 或 者 可 以 根据 线程 的 名 字 进 行 过 滤 。 此 外 ， 可 以 使 用 操作 集 来 选择 针对 特定 线程 的 事件 ， 
以 便 在 其 他 标签 页 中 查看 相关 数据 。 当 然 ， 还 可 以 选择 指定 的 线程 集合 。 

5. 栈 跟踪 标签 页 

该 标签 页 用 于 显示 事件 集合 的 调用 栈 信息 。 例 如 ,如 果 操 作 集中 包含 了 String 数组 的 分 配 

事件 集合 ， 则 在 该 标签 页 中 可 以 查找 到 string 数组 对 象 分 配 内 存 的 调用 栈 信息 。 

一 般 来 说 , 在 分 析 记 录 结 果 时 ， 当 使 用 其 他 标签 根据 感 兴趣 的 事件 集合 过 滤 原 始 数据 时 ， 会 
来 到 此 标签 页 。 此 外 该 标签 中 ， 还 显示 了 各 个 延迟 事件 的 起 始 调用 点 。 

6. 直方 图 标签 页 

在 直方 图 标签 页 中 可 以 展示 出 相关 延迟 事件 的 直方 图 ， 举 例如 下 。 
口 Object Allocation | Class Name: 可 用 于 找 出 分 配 的 哪些 类 最 常见 。 
口 Java Blocked | Lock Class: 可 用 于 找 出 应 用 程序 中 哪些 锁 最 常 阻塞 。 
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Q Java Wait | Lock Class: 可 用 于 找 出 应 用 程序 中 调用 wait () 方 法 时 在 哪里 消耗 的 时 间 
最 多 。 
在 找到 目标 事件 后 ， 可 以 将 之 添加 到 操作 集中， 以 便 在 其 他 标签 页 中 查看 相关 数据 。 


8.2.6 ”使 用 操作 和 集 


在 JRA 中 ,最 常 被 忽视 的 就 是 操作 集 ， 下 面 将 以 一 个 示例 来 说 明 操作 集 的 使 用 方法 。 在 该 
示例 中 ,使 用 了 预先 做 好 的 IRA 记录 ， 其 中 垃圾 回收 器 的 表现 不 其 理想 ， 执 行 频率 高 ， 且 执行 
时 间 长 ， 这 一 点 可 以 在 垃圾 回收 标签 页 和 内 存 标签 页 中 看 到 。 
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首先 ， 从 图 中 可 以 看 出 ， 垃 圾 回收 的 执行 时 间 确 实 长 达 数 十 毫秒 ,但 好 在 执行 频率 不 太 高 ， 
在 整个 记录 期 间 ， 共 发 生 了 5 次 垃圾 回收 。 面 对 这 种 问题 时 ,可 以 建议 用 户 使 用 准确 式 垃圾 回收 
器 ， 因 为 准确 式 垃 圾 回收 器 的 执行 频率 稍 高 一 些 ， 执 行 时 间 更 短 。 不 过 在 这 里 ,我 们 想 要 获知 更 
多 的 信息 ， 查 明 系 统 压 力 究竟 来 自 于 哪里 ， 而 不 仅仅 是 推荐 某 种 垃圾 回收 策略 。 

在 这 个 示例 中 ,为 了 显示 JRA 的 威力 ， 我 们 会 故意 搞 得 稍微 复杂 一 点 。 先 切换 到 延迟 数据 
标签 页 ， 查找 频繁 分 配 内 存 的 线程 ,然后 将 这 些 事件 添加 到 操作 集中 。 从 下 图 中 可 以 看 出 ， 大 部 
分 内 存 分 配 的 工作 都 由 排名 前 三 的 线程 完成 。 
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p® Finalizer N/A N/A Remove selection 0 bytes/s 
p® Timer-5 N/A N/A Set selection 0 bytes/s 
»® (GC Worker Thread 6) N/A N/A Clear 0 bytes/s 
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现在 ， 将 三 个 线程 的 所 有 的 事件 都 添加 操作 集中 ， 不 过 我 们 真正 感 兴趣 的 是 内 存 分 配 行为 。 
为 了 更 好 地 观察 结果 ， 可 以 切换 到 直方 图 标签 页 ， 为 操作 集中 的 内 存 分 配 事件 建立 一 个 直方 图 。 
正如 下 图 所 示 ， 由 于 我 们 期 望 查找 出 内 存 分 配 事件 主要 发 生 在 哪里 ， 所 以 将 操作 集 设置 为 只 显 
示 内 存 分 配 事件 。 一 般 情 况 下 ， 我 们 通常 不 关心 内 存 分 配 的 持续 时 间 ， 而 是 更 看 重 其 执行 次 数 。 
此 , 我 们 将 数据 按照 事件 发 生 次 数 排序 , 从 而 发 现 初始 化 String 实例 所 导致 的 内 存 分 配 次 数 最 多 。 
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然后 ， 进 入 到 栈 跟踪 标签 页 ， 并 勾 选 Show Only Operative Set 复 选 框 。 





object allocationjra 2 -~ 
Ti Traces 加 中 只 及 只 











o y 
yji 
a 
è 
3 
a 
R 
Fd 
9 
2 
5 
加 
H 
9 
3 
a 
g 
5 













i Traces 20 

RE] [F] Show only Operative Set 
4] Method Tract Count Total Latency 
Memory a ® comi Jevs.util.BufferDatalnputStream.readPaddedASCIstring(char{], int) 24 958 ms 
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fTuningWorkManagerlmpl$WorkAda| 24 958 ms 

.ExecuteThread.execute(Runnable) 24 958 ms 

Threads/Locks ® weblogic.work.ExecuteThread.runQ) 24 958 m: 


java.util. LinkedList.toArray(Obje = 3 s 
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从 截图 中 可 以 看 到 , 在 3 个 频繁 分 配 内 存 的 线程 中 ,几乎 所 有 实例 化 String 对 象 的 操作 都 
来 自 于 readPaddedascIIString(char [] ，int) 方 法 调用 。 如 果 再 加 上 char 数组 的 话 ， 就 
可 以 看 到 创建 数组 的 操作 也 是 在 同一 个 方法 中 ， 毕 竞 字 符 串 实际 上 就 是 对 字符 数组 的 封装 。 

通过 上 面 的 分 析 ， 可 以 得 出 结论 , 不 光 是 要 调整 垃圾 回收 策略 ,还 需要 大 幅 降 低 内 存 系统 的 
压力 ,具体 方式 是 减少 字符 串 对 象 的 创建 ,或 者 减少 对 这 种 会 创建 字符 串 对 象 的 方法 的 调用 次 数 。 
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有 些 情况 下 ， 即 使 启用 了 方法 采样 ,在 Code | Hot Methods 标签 页 中 也 没有 任何 数据 ， 最 
可 能 的 原因 是 , 应 用 程序 并 没有 产生 的 足够 多 的 负载 供 采 样 絮 收集 数据 。 方法 采样 器 只 会 对 那些 
活动 的 Java 代码 采样 ， 如 果 整 个 记录 过 程 非常 短 ， 而 且 线 程 大 部 分 时 间 都 在 等 待 执 行 ， 不 工作 ， 
那么 就 根本 没有 机 会 被 采样 器 捕 提 到。 如 果 不 是 在 生产 环境 分 析 应 用 程序 的 话 , 那么 需要 考虑 增 
加 应 用 程序 的 负载 ， 模 拟 生产 环境 中 的 真实 情况 。 

当 启 用 本 地 方法 采样 时 ， Mie 的 采样 信息 都 会 被 存储 下 来 ， 而 一 般 情 况 下 ， 只 会 存储 Java 
代码 的 采样 信息 。 通 过 采样 信息 , 你 可 以 会 发 现 几乎 所 有 的 本 地 采样 信息 都 来 自 于 某 个 本 地 方法 
(例如 ntdal1.dqll#KiFastSsystemCcallRet )， 甚 至 系统 几乎 一 直 空 闲 时 也 是 如 此 。 
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8.4 小 结 





本 章 介 绍 了 如 何 使 用 JRockit Runtime Analyzer 来 分 析 JRockit 运行 时 和 应 用 程序 的 行为 ， 如 
何 创 建 运行 记录 ， 并 通过 示例 介绍 了 可 以 从 记录 中 获取 到 哪些 信息 。 

本 章 还 介绍 了 如 下 几 种 耻 A 用 例 。 
口 如 何 找 出 应 用 程序 的 热 方法 。 
O 如 何 解读 记录 中 与 内 存 相 关 的 信息 ， 例 如 存活 对 象 集合 、 垃 圾 回收 相关 信息 、 碎 片 化 、 
对 和 象 汇总 信息 和 堆 信 息 直方 图 等 。 
口 如 何 追 查 与 延迟 相关 的 系统 问题 。 

此 外 , 本 章 还 使 用 一 个 示例 介绍 了 如 何在 延迟 分 析 器 中 通过 使 用 操作 集 来 缩减 信息 量 , 以 便 
快速 定位 问题 的 根源 。 

下 一 章 将 会 介绍 JRockit Flight Recorder, JFR H JRockit R28 和 JRockit Mission Control 4.0 版 
本 引进 ， 是 IRA 的 升级 版 。 本 章 所 提 到 的 大 部 分 内 容 都 适用 于 JFR 





























JRockit Flight Recorder 














事实 证 明 ， 使 用 JRA 的 执行 开销 很 小 ， 因 而 可 以 应 用 于 生产 环境 。 实 现 这 种 记录 引擎 的 项 
目 最 初 在 内 部 被 称 为 持续 JRA (continuous JRA )。 到 Rockit R28 版 本 时 ，JRA 正式 升级 为 JFR 
(JRockit flight recorder )。 
由 于 JER 的 运行 时 开销 极 低 ， 可 以 持续 分 析 应 用 程序 和 JVM 的 运行 行为 ， 即 便 是 发 生 了 某 
些 异常 情况 之 后 ， 也 能 回 到 那个 时 点 进行 分 析 。 这 一 特性 非常 有 用 ， 当 发 生 异 常情 况 时 ，JFR 会 
记录 下 所 有 可 能 导致 问题 的 事件 ， 以 便 可 以 排查 错误 。 当 然 ，JFR 也 作为 分 析 工 具 被 广泛 使 用 。 
本 章 主要 包含 以 下 内 容 : 
口 JFR 运行 方式 
O JFR 事件 模型 
口 如 何 进行 持续 记录 
O 如 何 执行 IRA RER 
口 JFR 中 记录 是 如 何 交 互 的 
口 如 何 设置 JFR 
口 JFR 和 JRA 的 主要 区 别 
口 如 何 记录 自 定义 事件 
口 如 何 扩展 JFR 客户 端 
O JFR 的 后 续 发 展 
























































9.1 JRA 进 化 


像 IRA 一 样 ，JFR 中 也 包含 了 两 大 部 分 ， 分 别 是 内 建 于 JRockit JVM 的 记录 引擎 和 内 建 于 
JRockit Mission Control 客户 端的 记录 分 析 工 具 。 记 录 引 擎 用 于 生成 可 供 分 析 工 具 处 理 的 记录 文 
件 。 分 析 文 件 并 不 要 求 必 须 有 活动 连接 ,其 本 身 是 自 描述 的 ， 即 文件 本 身 就 包含 了 所 有 相关 的 元 
数据 。 此 外 ， 该 文件 也 可 以 被 发 送 给 其 他 第 三 方 分 析 工 具 做 进一步 的 详细 分 析 。 


[$ 在 本 章 中 ，JFR 和 JFA 表 示 同 一 个 意思 ， 可 以 互 换 使 用 。 ] 
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在 JFR 中 ,记录 文件 不 再 使 用 XML 格式 。 所 有 内 容 均 记录 在 内 存 缓 冲 区 中 ， 并 辅 以 相应 的 
时 间 鹤 ,并 在 合适 的 时 机 写 和 人 到 构成 记录 的 二 进 制 文件 中 。 此 外 ,还 通过 专门 的 Java API 实现 了 
自 定 义 事件 和 自 定 义 用 户 分 析 接口 的 功能 。 
































第 8 章 中 曾经 提 到 过 ，JRA 的 记录 是 以 XML 格式 存储 的 ， 其 记录 文件 的 后 

BAA jra 而 在 JFR 中 , 文件 后 缓 名 变 成 了 jj 过， 存储 格式 也 改 成 了 二 进 制 格式 。 

> 由 于 可 能 会 产生 大 量 的 目标 事件 ， 需 要 避免 不 必要 的 开销 ， 将 数据 压缩 存储 。 
JIRA 记录 无 法 向 前 兼容 ，JFR 也 无 法 打开 IRA 的 记录 文件 。 


9.1.1 关于 事件 


正如 前 面 介绍 的 ， 在 JFR 中 ， 事 件 就 是 在 某 个 具体 的 时 间 点 记录 下 的 数据 。 

事件 有 以 下 几 种 类 型 。 

O 持续 事件 (duration event): 指 事件 会 持续 一 段 时 间 ， 记 录 的 内 容 包 含 了 起 始 时 间 和 截止 

时 间 ， 例 如 Garbage Collection 事件 。 

口 计时 事件 (timed event): 指 可 以 设置 持续 时 间 辣 值 的 持续 事件 ， 例 如 Java Wait 事件 和 

Java Sleep 事件 。 

O 立即 事件 ( instant event ): 指 事件 不 会 持续 , 记录 的 内 容 也 只 有 开始 时 间 , 例如 Exception 

事件 和 Event Settings Changed 事件 。 

口 可 请 求 事件 (requestable event ): 指 可 以 被 配置 为 周期 性 轮 询 记 录 引 擎 的 事件 。 该 事件 是 

通过 在 记录 引擎 中 使 用 一 个 单独 的 线程 来 定时 调用 指定 方法 实现 的 ， 例 如 CPU Load 
Sample 事件 。 

JER 中 记录 的 事件 由 事件 生成 器 产生 , 事件 生成 器 (event producer ) 定义 了 事件 的 具体 类 型 。 
事件 类 型 (event type 或 actual event) 中 包含 了 用 于 描述 该 类 型 本 身 信息 的 元 数据 ， 这 些 元 数据 
中 包含 了 该 事件 本 身 所 包含 的 属性 信息 、 属 性 的 类 型 信息 和 属性 的 具体 描述 信息 。JFR 的 记录 文 
件 中 都 包含 了 对 该 事件 生成 器 的 描述 信息 。 

JRockit JVM 作为 其 中 一 种 事件 生成 器 ， 优 势 巨 大 ， 它 能 够 以 较 小 的 运行 时 开销 ， 很 方便 地 
记录 下 运行 时 需要 收集 的 事件 信息 。 此 外 ， 用 户 可 以 通过 调用 相关 的 Java API， 在 JRockit JVM 
创建 的 底层 事件 上 附加 额外 的 上 下 文 属性 。 


9.1.2 ”记录 引擎 


记录 引擎 (recording engine )， 有 时 也 称 为 记录 代理 ， 内 建 于 JVM 之 中 ， 针 对 事件 生成 做 了 
大 量 优 化 以 完成 相关 任务 ， 这 些 任务 包括 如 下 几 种 。 

口 记录 工具 : 记录 引擎 的 主要 用 途 肯定 是 记录 应 用 程序 运行 过 程 中 所 发 生 的 事件 。 为 了 高 

效 完成 记录 任务 ， 其 内 部 使 用 了 线程 局 部 缓冲 ， 当 发 生 事 件 时 就 将 其 记录 到 局 部 缓冲 中 ， 

若 线程 局 部 缓冲 已 满 ， 就 记录 到 全 局 缓冲 区 (globalbuffer ) 中 。 如 果 全 局 缓冲 区 也 满 了 ， 
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则 根据 配置 选项 来 决定 ， 是 以 二 进 制 格式 将 全 局 缓冲 区 中 的 内 容 写 人 到 硬盘 中 ， 还 是 循 
环 重 用 之 前 的 区 域 。 参 见 下 图 。 

口 追踪 调用 栈 : 预先 配置 相关 选项 后 ，JFR 会 在 记录 相关 事件 时 ， 顺 带 记 录 下 调用 栈 信 息 。 

在 查找 事件 发 生源 时 ， 这 些 信 息 将 非常 有 用 。 

ORS SE: 设置 相应 的 阔 值 后 ，JFR 只 会 记录 执行 时 间 超 过 该 阔 值 的 事件 ,这样 就 可 以 过 

滤 掉 一 部 分 事件 ， 防 止 产生 过 多 记录 。 每 种 事件 类 型 都 可 以 设置 各 自 的 闽 值 。 

口 附带 时 间 戳 : 正如 第 5 章 中 介绍 的 ， 使 用 system. currentTimeMillis () 方 法 获取 系 
统 时 间 具 有 不 小 的 执行 开销 。 因 此 ， 记 录 引 擎 为 记录 时 间 戳 提供 了 一 个 高 度 优化 的 本 地 
时 间 版 本 ， 如 下 所 示 。 



































充满 时 复制 充满 时 转 储 


全 局 缓 站 
Java API 
全 局 缓冲 区 


















































全 局 缓冲 区 
JVM Events 


由 于 JRockit R28 是 作为 补丁 版 本 发 布 的 ， 若 是 默认 开启 事件 记录 可 能 会 带 

来 一 些 麻烦 。 故 而 决定 在 启动 JVM 时 ， 并 不 会 立即 启动 记录 引擎 。 其 实在 设计 

之 初 ,记录 引擎 和 JRockitJVM 事件 发 生源 就 是 放 在 一 起 考虑 的 ， 在 开发 测试 过 

程 中 ， 也 都 是 放 在 一 起 的 ， 即 便 是 做 压力 测试 时 ， 也 不 例外 。 在 将 来 的 JRockit 
版 本 中 ， 可 能 会 对 记录 引擎 做 一 些 改动 。 

















对 于 正在 执行 的 事件 记录 而 言 ， 都 会 有 一 个 ID 和 名 字 ， 其 中 ID 具有 唯一 性 。 记 录 ID 会 在 
创建 记录 时 自动 设置 ， 用 于 标识 当前 的 记录 。 例 如 ， 可 以 在 IRCMD 中 ， 通 过 记录 ID 来 引用 某 
个 事件 记录 。 

在 启动 Rockit 时， 附加 以 下 命令 行 参数 ， 即 可 启用 JFR 事件 记录 : 

-XX:FlightRecorderOptions=defaultrecording=true 
使 用 上 面 的 命令 行 参 数 ， 可 以 创建 一 个 ID 为 0、 名 字 为 Rockit default 的 事件 记录 。 
JER 中 可 以 同时 存在 多 个 事件 记录 。 如 果 同 时 有 多 个 事件 记录 处 于 活动 状态 ， 则 在 记录 的 时 
会 将 各 自 的 事件 类 型 聚合 ,并 根据 预 设 的 阔 值 过 滤 。 对 于 刚刚 接触 JFR 的 用 户 来 说 , 这 可 能 
了 # 来 一 些 困 扰 ， 而 实际 上 ， 确实 有 可 能 出 现 记录 的 事件 比 期 望 的 多 的 情况 。 

想 要 记录 更 详细 的 信息 ,可 以 通过 修改 默认 记录 的 事件 设置 (event setting ) 对 记录 引擎 做 详 
细 配 置 , 或 者 使 用 不 同 的 配置 开启 一 个 新 的 记录 。 如 果 想 要 过 滤 掉 多 余 的 记录 信息 , 请 修改 相关 
配置 。 
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913 AmB 
有 多 种 方式 可 用 于 配置 记录 引擎 ， 不 过 其 中 的 某 些 方式 只 能 在 以 命令 行 启 动 JVM 时 使 用 。 
有 两 个 主要 的 命令 行 参数 用 于 配置 JTR。 其 一 是 用 于 控制 是 否 开启 JFR 的 命令 行 参数 : 
-XX: [+|-]FlightRecorder 
其 二 是 用 于 控制 JFR 运行 行为 的 命令 行 参数 : 


-XX:FlightRecorderOptions=parameterl=valuel[,parameter2=value2 ] 



































可 用 参数 如 下 表 所 示 。 
参 。 数 描述 








settings=[name|filepath] 在 服务 器 端 载 和 额外 的 配置 模板 。 默 认 情况 下 , 配置 模板 存在 于 JROCKIT_HOME/jre/lib/jfr 

路 径 下 。 关 于 服务 器 端 模 板 的 更 多 信息 ， 请 见 后 文 
repository=[dir] JER 记录 数据 的 路 径 ， 可 看 作 JFR 的 临时 目录 。 默 认 情况 下 ， 存 放 于 java.io.tmpdir 
属性 定义 的 目录 下 , 子 目录 的 名 字 格 式 为 yyyy mm dd hh mm ss_pid。 例 如 , 若 进 程 号 为 










































































































































































4711， 则 创建 的 临时 目录 的 名 字 为 2010 04 21 16 28 59 4711 
threadbuffersize=[size] 上 定 线程 局 部 缓冲 区 (thread local buffer) 的 大 小 ， 默 认 值 为 5KB 
globalbuffersize=[size] 指定 全 局 局 部 缓冲 区 (global local buffer) 的 大 小 ， 默 认 值 为 64KB 
numglobalbuffers= [num] 者 定 全 局 局 部 缓冲 区 的 数量 ， 默 认 值 为 8 
maxchunksize=[size] 指定 存储 的 单个 数据 块 的 大 小 ， 默 认 值 为 12MB 
cont inuous=[true| false] 指定 是 否 启 用 默认 的 连续 记录 ， 即 使 用 记录 ID 0 进行 连续 记录 。 无 论 该 值 设置 为 true 

还 是 false， 只 要 启用 了 JFR, 都 可 以 通过 Rockit Mission Control 来 开启 连续 记录 。 正 如 

前 文 提 到 的 ,在 JRockit R28 中 ， 禁 用 了 默认 记录 ， 不 过 在 将 来 的 版 本 中 可 能 会 将 之 开启 
disk=[true| false] 指定 是 否 将 数据 记录 到 硬盘 中 。 默 认为 false， 即 会 循环 使 用 内 存 空间 的 记录 区 域 。 通 过 

JRockit Mission Control 或 JRCMD, ， 可 以 手动 将 记录 内 容 刷 人 到 硬盘 中 
maxage= [nanot ime] 指定 数据 在 硬盘 上 保留 的 最 长 时 间 ， 单 位 为 纳 秒 ， 默 认 值 为 0， 即 保留 所 有 数据 
maxsize=[size] 指定 最 多 保留 多 少数 据 ， 默 认 值 为 0， 意 味 着 保留 所 有 数据 





























无 论 是 使 用 IRCMD 还 是 命令 行 参数 ， 指 定 的 参数 选项 都 会 通过 模板 文件 以 JSON 格式 被 记 
录 下 来 。 JRockit 发 行 版 中 附带 了 几 个 示例 模板 , 位 于 JROCKIT_HOME/jre/lib/jfr Axe Fo 这 些 模 
板 就 是 所 谓 的 服务 器 端 模板 (server-side template )， 因 所 使 用 的 JRockit Mission Control 客户 端 不 
同 而 有 所 区 别 。 基 于 这 些 模 板 ， 用 户 可 以 根据 实际 需要 开发 定制 模板 。 








有 关 服 务 器 端 模板 的 详细 内 容 超 出 了 本 书 的 范畴 ， 这 里 不 再 珊 述 。 第 11 章 
> 将 会 介绍 如 何 使 用 JRCMD 来 控制 记录 的 生命 周期 。 
开启 基于 时 间 的 记录 
与 JRA 类 似 , JFR 也 可 以 通过 命令 行 参数 来 开启 有 时 间 限 制 的 记录 。 在 JFR 中 , 命令 行 参数 
-XX:StartFlightRecording 可 用 于 对 执行 时 间 做 相关 设置 , 例如 , 可 以 推迟 记录 的 执行 时 间 
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以 便 可 以 跳 过 JVM 热身 的 阶段 。 下 面 的 示例 中 ，JFR 会 在 JVM 启动 2 分 钟 后 再 开始 记录 ， 记 录 
持续 一 分 钟 ， 记 录 名 为 MyRecording， 并 将 结果 存储 到 c:\tmp\myrecording.jfr 中 。 当 然 ， 这 里 也 
可 以 使 用 服务 器 端 模 板 ， 通 过 名 称 引 用 即 可 ， 在 示例 中 使 用 的 模板 文件 是 profile.jfs。 


-XX:StartFlightRecording=delay=120s,duration=60s, 
name=MyRecording, filename=C:\tmp\myrecording.jfr,settings=profile 


| 更 多 有 关 命 令 行 参 数 StartFlightRecording 选项 的 内 容 , 请 参见 JRockitR28 | 
—_ 









































的 相关 手册 。 








本 章 的 剩余 部 分 将 着 重 介 绍 如 何 通过 TRockit Mission Control 客户 端 来 控制 JER 和 查看 记录 。 











9.2 在 JRockit Mission Control 中 使 用 JFR 





在 JRockit Mission Control 客户 端 中 可 以 很 方便 地 控制 事件 记录 的 生命 周期 ， 推 荐 使 用 。 

在 JRockit Mission Control 中 开启 JFR 事件 记录 很 简单 ， 在 JVM 浏览 器 右键 点 击 目标 JVM ， 

在 弹出 的 菜单 中 点 击 Start Flight Recording. . . 即 可 。 

以 JRockit Mission Control 4.0 版 本 为 例 ， 在 点 击 Start Flight Recording. . . 菜单 之 后 ， 会 : 

(1) 弹出 Start Flight Recording 对 话 框 

(2) 进入 Flight Recorder Control 视图 

Flight Recorder Control 视图 是 在 JRockit Mission Control 4.0 版 本 中 新 引入 的 ， 用 于 展示 当 

前 可 用 的 JVM 连接 中 都 有 哪些 事件 记录 ， 并 对 事件 记录 进行 控制 。 

与 RA 类似， 在 Start Flight Recording 对 话 框 中 ， 可 以 选择 一 些 系统 内 置 的 模板 ， 也 可 以 自 

己 创 建新 的 模板 。 这 些 模板 不 同 于 服务 器 端 模 板 , 可 用 于 图 形 界面 , 并 且 解 析 过 程 也 有 所 区 别 ( 没 

有 通配符 )。 

默认 的 客户 端 模 板 包括 以 下 几 种 。 

O 普通 概要 分 析 (default profiling): 以 较 低 的 执行 开销 执行 一 些 通用 分 析 的 模板 。 

O 带 有 锁定 的 概要 分 析 ( profiling with lock): 与 普通 概要 分 析 相 同 ， 并 额外 启用 了 锁 分 析 。 
使 用 该 模板 时 ,需要 在 启动 JVM 时 ， 添 加 命令 行 参数 -XX:+UseLockProfiling， 不 过 
使 用 该 命令 行 参 数 会 带 来 一 些 性 能 损耗 ， 甚 至 在 不 记录 的 时 候 也 有 。 

口 带 有 异常 错误 的 概要 分 析 ( profiling with exception): 与 普通 概要 分 析 相 同 ， 并 且 启 用 了 
异常 分 析 。 对 于 大 多 数 应 用 程序 来 说 ， 使 用 该 模板 的 执行 开销 与 使 用 普通 概要 分 析 模 板 
没什么 区 别 ， 但 是 对 于 某 些 会 经 常 抛 异 常 的 应 用 程序 来 说 ， 这 个 执行 开销 就 很 可 观 了 。 

口 实时 (real-time ): 该 模板 更 关注 与 垃圾 回收 相关 的 事件 ， 而 对 其 他 资源 的 饥饿 事件 则 不 
予 理 会 。 

值得 注意 的 是 , 默认 的 客户 端 模 板 和 服务 器 端 模 板 在 默认 情况 下 都 会 忽略 异常 事件 ,因为 很 

难 准确 评估 异常 在 那些 烂 应 用 程序 中 所 产生 的 影响 。 若 想 分析 异 常 , 请 选择 带 异 常 错误 的 概要 分 
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析 模 板 。 本 章 后 面 将 介绍 有 关 异 常 的 概要 分 析 。 

在 选择 了 模板 之 后 , 需要 指定 记录 文件 的 存储 位 置 ， 以 及 为 该 记录 取 个 名 字 。 某 些 事 件 生成 
器 (例如 WebLogic diagnostics framework ) 中 会 运行 自己 的 事件 记录 。 在 一 个 大 型 系统 中 ， 可 能 
会 同时 存在 多 个 事件 记录 并 行 运行 。 因 此 ， 为 事件 记录 取 个 好 名 字 会 使 其 容易 被 找到 。 











除了 JVM 外 ， 还 有 一 些 其 他 系统 也 会 记录 事件 ， 例如 Oracle WebLogic 
Diagnostics Framework 和 Oracle Dynamic Monitoring 系统 。 和 希望 在 将 来 的 版 本 中 
可 以 添加 更 多 的 事件 生成 器 ， 如 JRockit Virtual Edition. 





在 对 话 框 中 可 以 选择 创建 一 个 有 了 时限 的 记录 , 或 是 一 个 持续 记录 。 如 果 是 有 时 限 的 记录 ， 则 
需要 指定 记录 的 持续 时 间 。 为 了 限制 持续 记录 的 资源 使 用 情况 ， 可 以 限制 所 记录 数据 的 大 小 、 记 
录 时 间 。 

然后 ， 点 击 Continue 按钮 ， 将 会 开始 执行 事件 记录 。 

Flight Recorder Control 视图 总 会 显示 出 这 个 新 创建 的 事件 记录 。 对 于 有 时 限 的 记录 来 说 ， 
会 显示 出 该 记录 的 剩余 时 间 ， 并 定时 更 新 ; 而 如 果 是 持续 记录 的 话 ， 则 会 在 剩余 时 间 人 处 显示 一 个 
无 穷 大 符号 。 

在 Flight Recorder Control 视图 的 工具 条 上 有 一 个 表 设 置 按钮 国 ， 可 用 于 设置 要 显示 哪些 字 
段 内 容 。 

对 于 有 时 限 的 事件 记录 来 说 ， 当 记录 完成 时 ， 会 自动 下 载 记 录 内 容 。 

正如 前 面 提 到 的 ， 可 在 Flight Recorder Control 视图 中 一 次 查看 多 个 JVM 记录 图 。 若 想 在 
监视 器 中 添加 新 的 连接 ， 只 需 在 JVM 浏览 器 视图 右键 点 击 目 标 连接 。 选 择 Show Recodings X 
单 即 可 。 

若 想 从 正在 进行 的 事件 记录 中 导出 数据 ， 只 需要 右键 点 击 该 事件 记录 ， 选 择 Dump. . . 菜单 
即 可 ， 在 弹出 的 Dump Recording 对 话 框 中 做 下 一 步 配 置 。 

在 转 储 记录 时 ， 有 3 种 不 同 的 方式 可 选 。 

口 完整 记录 : 转 储 所 有 可 用 数据 。 

口 记录 的 最 后 部 分 : 转 储 某 个 给 定时 间 段 内 的 记录 的 最 后 一 部 分 数据 。 注 意 ， 有 可 能 会 得 

到 比 期 望 值 更 多 的 数据 ， 因 为 转 储 的 时 候 ， 会 将 整 块 数据 转 储 。 

口 记录 间隔 : 将 给 定时 间 段 内 的 数据 转 储 。 注 意 ， 指 定 的 时 间 是 服务 器 时 间 。 如 果 客 户 端 
在 斯 德 哥 尔 摩 ， 而 服务 器 在 东京 ， 请 确保 时 间 设 置 正 确 。 如 果 在 指定 的 时 间 段 内 没有 数 
据 ， 会 显示 一 条 错误 信息 。 

再 次 强调 ， 转 储 得 到 的 数据 可 能 会 比 期 望 值 多 。 

以 完整 记录 方式 转 储 的 数据 会 按照 固定 大 小 划分 为 多 个 数据 块 , 其 中 的 每 个 数据 库 都 包含 了 

个 常量 池 ， 用 于 解析 数据 块 内 的 数据 ， 例 如 包含 在 事件 中 的 调用 栈 信息 。 当 事件 对 象 包含 了 

调用 栈 信息 时 ， 就 可 以 通过 索引 在 常量 池 查 找 相 应 的 事件 信息 。 这 样 ， 每 个 数据 块 就 成 为 了 自 

包含 的 。 
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自 定义 JFR 记录 


在 JFR 记录 创建 对 话 框 中 可 以 自 定义 模板 。 单 击 模 板 名 旁边 的 Advanced. . . 按钮 ， 可 以 进 
人 到 模板 编辑 对 话 框 。 

在 对 话 框 的 左 侧 是 事件 类 型 树 , 在 其 中 选择 配置 某 个 父 节点 后 , 会 递归 地 应 用 到 其 所 有 的 子 
节点 中 。 如 果 为 不 同 的 子 节点 做 了 不 同 的 设置 ， 则 不 会 在 父 节点 上 显示 属性 值 。 

勾 选 事件 类 型 树 下 面 的 复 选 框 , 则 会 过 滤 掉 与 模板 无 关 的 事件 类 型 。 若 某 个 节点 下 的 子 节点 
从 属于 某 个 模板 , 则 会 以 黑体 字 显 示 该 节点 。 在 当前 模板 中 , Log 节点 下 没有 显示 任何 事件 类 型 。 

事件 类 型 树 中 所 显示 的 事件 类 型 取决 于 当前 运行 的 是 何 种 应 用 程序 ( 应 用 程序 也 可 能 会 使 用 
到 JFR API )， 以 及 模板 的 具体 配置 。 这 种 方式 使 用 户 可 以 修改 那些 源 自 于 非 JRockit JVM 默认 事 
件 生 成 器 的 事件 类 型 。 

修改 事件 类 型 的 属性 后 ， 会 以 粗 体 突出 显示 ， 用 以 指明 它们 是 新 模板 的 一 部 分 。 

可 以 从 高 级 模板 编辑 对 话 框 中 导 和 人 服务 器 端 模板 ， 此 时 最 好 先 清除 掉 其 他 相关 设置 ， 点 击 
Clear 按钮 即 可 。 导 入 功能 是 附加 的 ,因为 服务 器 端 模板 本 来 就 是 要 这 样 。 因 此 , 在 应 用 的 时 候 ， 
就 可 以 先 从 默认 记录 开始 ， 再 通过 导 人 默认 模板 来 添加 锁 分 析 ， 再 导入 锁 模 板 。 

进入 高 级 对 话 框 来 创建 一 个 模板 的 临时 副本 ,点击 OK 按钮 来 保存 该 临时 副本 。 如 果 在 模板 
名 旁边 有 星 写 (* )， 表明 该 模板 还 没有 被 保存 。 如 果 只 是 临时 针对 某 个 记录 而 修改 了 模板 ,那么 
就 不 必 保 存 。 

在 Start Flight Recording 对 话 框 中 点 击 OK 按钮 ,使 记录 可 以 在 第 一 次 保存 之 前 就 可 以 使 用 。 
在 后 续 的 操作 中 ， 该 模板 都 可 以 使 用 ， 但 在 重启 JRockit Mission Control 之 后 就 会 丢失 。 

要 保存 模板 ， 请 点 击 Save. . . 按钮 。 

保存 了 记录 之 后 ， 就 可 以 重用 了 ， 即 便 JVM 无 法 支持 模板 中 配置 的 所 有 事件 类 型 ， 也 仍然 
可 以 使 支持 的 事件 类 型 生效 。 例 如 ， 当 应 用 在 不 支持 日 志 事 件 类 型 的 JVM 上 时 ， 包 含 了 日 志 事 
件 类 型 的 模板 中 会 以 斜体 字 演 染 日 志 事 件 类 型 。 
















































































































































































9.3 与 JRA 的 区 别 


由 于 JFR 是 基于 事件 记录 的 ， 在 实现 上 与 JRA 有 很 大 区 别 。 例 如 ， 在 JFR 中 ， 几 乎 所 有 的 
标签 页 都 有 范围 选择 器 。 因 为 是 基于 事件 记录 的 ,所 以 可 以 通过 指定 时 间 范 围 进行 过 滤 ， 而 且 数 
据 的 粒度 可 以 更 细 ， 数 据 源 也 更 多 。 

下 面 会 对 其 中 的 区 别 做 详细 介绍 。 


























9.3.1 范围 选择 器 


正如 前 面 提 到 的 , 在 JR 中 , 几乎 所 有 的 标签 页 都 有 范围 选择 器 。 范 围 选 择 需 的 背景 图 案 显 
示 了 在 记录 时 间 范 围 内 所 发 生 的 事件 数量 。 例 如 ， 在 概览 标签 页 内 ， 包 含有 堆 、 垃 圾 回收 、CPU 
使 用 率 和 通用 信息 事件 。 
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使 用 基于 事件 的 数据 模型 所 带 来 的 影响 是 , 可 以 通过 范围 选择 器 来 选取 出 有 数据 但 没事 件 的 
时 间 区 间 。 在 第 8 章 中 曾 介绍 过 ， 有 些 概览 信息 是 写 在 记录 尾部 的 。 在 JFR 中 ， 某 些 事 件 会 写 到 
记录 块 (chunk ) 的 尾部 。 如 果 选 取 的 范围 中 并 没有 期 望 的 事件 ， 则 会 显示 N/A。 因 此 ， 在 修改 
选择 范围 时 ， 应 该 注意 是 否 还 包含 有 期 望 的 事件 。 

由 于 范围 选择 器 在 很 多 地 方 都 会 用 到 , 需要 在 响应 的 地 方 同步 。 勾 选 Synchronize Selection 
复 选 框 ， 确 保 其 他 使 用 了 范围 选择 的 标签 页 可 以 同步 修改 。 

E JRA 中 的 情况 类 似 ， 修 改 了 操作 和 集 之 后 ， 会 突出 显示 。 


9.3.2 ”操作 集 


相 比 于 JRA ,操作 集 功 能 有 所 增强 ,现在 可 以 在 绝 大 部 分 视图 中 修改 操作 集 ,即便 是 模拟 IRA 
风格 的 标签 页 也 是 如 此 。 


9.3.3 KEK 


每 个 事件 属性 都 有 一 个 关联 键 (relational key )， 全 局 唯一 ， 用 于 与 其 他 事件 类 型 相 区 别 。 例 
如 ,垃圾 回收 事件 的 关联 键 是 GCID ,格式 为 http://www.oracle.com/jrockit/jvm/vm/gc/ 
id。 通 过 GCID 就 可 以 方便 地 找 出 所 有 与 指定 垃圾 回收 相关 的 事件 。 


| 关联 键 采 用 了 URI 的 格式 ， 类 似 于 XML 文件 中 的 命名 空间 。 ] 




















































































































在 用 户 界 面 中 ， 可 以 通过 上 下 文 菜单 将 关联 键 添加 操作 和 集中。 

第 三 方 事件 生成 器 可 以 在 多 个 生产 者 之 间 使 用 关联 键 来 标识 某 个 事件 。 例 如 , WLDS 和 DMS 
使 用 关联 键 ECID (execution context ID ) 在 WebLogic Server 的 探 针 和 生产 者 之 间 标 识 相 应 事件 ， 
又 或 者 将 所 有 与 某 个 数据 库 调用 相关 的 事件 都 添加 到 操作 和 集 当中 。 

生产 者 也 可 以 为 其 他 属性 提供 关联 键 。 
































9.3.4 延迟 分 析 


一 切 皆 事件， 因此 不 必 像 JRA 那样 假设 所 有 的 事件 都 会 有 相关 延迟 。 相 关 延 迟 是 指 事件 会 
直接 拖延 线程 的 执行 。 在 FR, 有 专门 的 标签 页 来 处 理 具有 延迟 相关 的 事件 , 但 那些 具有 延迟 
相关 的 Java 事件 仍 需要 以 类 似 IRA 延迟 分 析 器 那 种 方式 来 展示 。 

事件 标签 组 中 包含 了 用 于 事件 可 视 化 的 通用 标签 组 ， 类 似 于 JRA 中 的 延迟 标签 组 。 

如 果 在 事件 类 型 视图 中 ， 只 选择 Java 应 用 程序 事件 ， 则 结果 会 与 及 A 延迟 分 析 絮 中 的 结果 
类 似 。 

在 CPU | 线程 标签 组 中 有 专门 与 延迟 相关 的 标签 页 。 在 JFR 中 , 增加 了 一 些 新 的 标签 页 ,用 
于 汇总 延迟 相关 的 事件 。 例 如 , 在 延迟 标签 页 对 事件 类 型 做 了 汇总 ,并 为 选中 的 事件 类 型 显示 调 
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用 栈 信息 。 
JER 中 引入 的 争 用 标签 页 用 于 展示 Java 阻 塞 事件 (线程 阻塞 ， 等 待 获取 监视 器 ), 在 下 图 中 ， 








展示 的 是 WebLogic Server 中 的 事件 记录 ， 从 中 可 以 看 到 ， 在 调用 loadwebApp 方法 时 ， 需 要 获 








取 weblogic.wervlet.internal .HttpServer 示例 的 监视 器 ， 这 个 过 程 所 消耗 的 时 间 最 多 。 
























































Wif latenciesjfr (W JRockitFlightRecorder_QAMedRec HighVolumejfr 53 = Tm) 
@ Contention 
B Events E Operative Set Synchronize Selection 
General Recording Start 123300 i ° Recording End: 12:37:40 
ecording Start: 12:33 A ecording End: 12:37: 
的 ] Top Blocking Locks| Top Blocked Threads| Top Blocking Threads 
emory 
- Class Count Duration (avg) Duration (tota) ^ 
GL © weblogic.serviet.internal.HttpServer 2 15 248,412 ms 2. 496,823 ms 
© sun.misc.LauncherSAppClassLoader 32 74,746 ms 2s 391,870 ms 
Code © weblogic.utils.classloaders.GenericClassLoader 16 55,778 ms 892,451 ms |= 
© java.util. HashMap 2 283,339 ms 566,679 ms 
© © weblogic. management.jmxmbeanserver. WLSMBeanServer 1 380,252 ms 380,252 ms 
0 © com.beaxml.SchemaTypesRef 5 47,517 ms 237,586 ms |_| 
© com.bea.staxb.runtime.internal.RuntimeBindingTypeTable 5 25,490 ms 127,449 ms 
CPU/Threads| z 
 java.net.URLClassLoader 3 35,162 ms 105,487 ms 
Ene EE RET GV A E N a INA m oran- ` 
ge Trace Count Duration ^ 
: m weblogic.servlet.internal.HttpServer.loadWebApp(WebAppComponentMBean, Application 2 2s 496,823 ms 
Weblogic % weblogic.servlet internal. WebAppModule.registerWebApp(HttpServer) 2 2s 496,823 ms 
5 weblogic.servlet.internal.WebAppModule.prepare() 2 2s 496,823 ms 
5 weblogic.application.internal flow.ScopedModuleDriver.prepare() 2 2s 496,823 ms 
5 weblogic.application.internal.flow.ModuleListenerlnvoker.prepareQ) 2 2s 496,823 ms |= 
ae x% weblogic.application.internal.flow.DeploymentCallbackFlowS1.next(Obje 2 2s 496,823 ms 
x% weblogic.application.utils.StateMachineDriver$ParallelChangeS1.run( 2 2s 496,823 ms 
= weblogic.security.acl.internalAuthenticatedSubject.doAs(Abstrac 2 2s 496,823 ms 
® weblogic.security.service,SecurityManager.runAs(Authenticate 2 2 s 496,823 ms| 
x% weblogic.application.utils.StateMachineDriverSParallelCha 2 2s 496,823 ms 
's_iava.lang.Thread.run() 2 2s 496,823 ms ~ 
®& Overview | gÈ Hot Threads | g? Contention | JE Latencies| g® Lock Profiling | 
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与 JRA 类 似 ， 可 以 在 JFR 中 启用 详细 的 锁 分 析 ， 当 然 ， 开 启 之 后 ， 不 论 是 否 在 执行 分 析 ， 
都 会 给 运行 时 带 来 额外 的 负担 。 启 动 JRockit 时 ,添加 命令 行 参数 -XX:+UseLockProfiling 以 
启用 锁 分 析 。 更 多 详细 信息 ， 请 参见 第 4 章 内 容 。 


9.3.5 ”异常 分 析 


FE JRA 中, 只 能 统计 被 抛 出 的 异常 数量 。 若 想 关联 代码 中 抛 出 并 捕获 的 异 带 , 就 不 得 不 修改 JVM 
的 日 志 设 置 ， 例 如 ， 通 过 IRCMD 或 在 JVM 的 启动 参数 中 添加 -xverbose:exceptions=debug 
选项 。 就 JFR 来 说 ， 有 专门 的 事件 类 型 和 必要 的 信息 来 记录 异常 事件 , 便于 查看 。 在 创建 记录 的 
时 候 ， 使 用 包含 异常 分 析 的 模板 即 可 。 


在 争 用 标签 页 中 ， 还 可 以 看 到 ， 哪 些 线程 最 容易 被 阻塞 ， 哪 些 线程 最 容易 阻塞 其 他 线程 。 
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上 图 中 的 示例 ， 是 运行 Java 2D 示例 应 用 程序 所 做 的 记录 ， 从 中 可 以 看 到 ， 大 部 分 
InterruptedException 异常 都 由 java2d.AnimatingSurface.run() 方 法 抛 出 。 范 围 选择 
器 中 显示 ， 有 两 个 抛 出 异常 的 峰值 ， 分 别 在 记录 的 开始 和 结束 时 。 记 录 开 始 时 大 量 抛 出 的 是 
ClassCastException 异常 , 而 在 结束 时 抛 出 的 主要 是 NoSuchMethodException 异常 。 通过 
范围 选择 器 将 时 间 范 围 限定 到 峰值 附件 可 以 很 清楚 地 看 到 这 一 点 。 如 下 图 所 示 。 
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Java 2D 示例 应 用 程序 并 不 会 抛 出 太 多 异常 ， 因 此 只 能 用 来 介绍 如 何 使 用 相关 用 户 界 面 。 在 
实际 场景 中 ， 如 果 应 用 程序 抛 出 的 异常 太 多 ， 就 应 该 详 查 原因 了 。 


9.3.6 内存 分 析 


RE JFR 中 的 内 存 分 析 标 签 页 与 JRA 非常 相似 ， 还 是 有 一 些 事情 需要 注意 一 下 。 

在 内 存 | 概览 标签 页 中 ，Total Physical Momery 和 Used Physical Memory 数值 均 指 向 当前 
机 器 的 物理 内 存 ， 而 不 是 Java 进程 的 内 存 。 在 之 前 的 Java 2D 示例 应 用 程序 记录 中 ,应 用 程序 是 
在 一 台 具 有 4 GB 内 存 的 机 器 上 运行 的 ， 在 开始 记录 的 时 候 ， 已 经 使 用 了 大 约 2.2 GB AF. Java 
堆 申 请 的 内 存 只 有 128 MB。 这 些 数据 可 以 在 内 存 标签 页 的 展示 图 或 垃圾 回收 配置 中 看 到 。 在 堆 
容量 标签 页 可 以 看 到 相关 展示 图 。 

在 堆 容量 标签 页 中 包含 了 两 个 展示 图 , 一 个 用 于 展示 堆 中 容量 , 另 一 个 用 于 展示 堆 中 空闲 空 
间 的 分 布 。 这 需要 注意 的 是 ， 这 里 使 用 了 碎片 化 来 描述 堆 中 内 存 的 分 布 情况 ， 更 加 直观 。 

在 空闲 内 存 分 布 ( free memory distribution) 图 中 ,灰色 图 案 表示 已 使 用 的 内 存 数 量 ， 并 区 分 
出 已 使 用 的 部 分 和 碎片 部 分 。 示 例 图 所 显示 的 堆 内 存 处 于 非常 良好 的 状况 , 空闲 内 存 很 多 ,碎片 
化 程度 较 低 ， 连 续 的 空闲 空间 很 大 。 如 果 堆 中 满 是 小 的 空闲 块 ， 则 无 法 为 较 大 的 数组 分 配 内 存 ， 
从 而 导致 垃圾 回收 ， 执 行 耗 时 的 内 存 整理 操作 ， 甚 至 暂停 应 用 程序 的 运行 。 








Heap Contents | Free Memory Distribution | 
E Free Blocks Huge (> 512 kB) M Free Blocks Large (<= 512 kB) Ml Free Blocks Medium (<= 64 kB) Ml Free Blocks Small (<= 8 kB) 器 Occupied 
128,00 MB 





11200 MB 






96,00 MB 
MB 

> 80,00 
$ 4,00 MB 
48,00 MB 
3200 MB 


16,00 MB 


0 bytes 














104048 1040:54 104100 104106 1041:12 1041:18 104124 1041:30 1041:36 104142 
Time Free Huge Free Large Free Medium Free Small 
2010-02-19 10:40:43 338ms 98,956 MB 10,708 MB 2,394 MB 0,997 MB 
2010-02-19 10:41:43 345ms 100,048 MB 6,233 MB 4,923 MB 2,178 MB 








下 图 来 自 于 一 个 有 内 存 泄 漏 的 示例 应 用 程序 , 在 第 10 章 中 会 对 其 做 进一步 介绍 。 如 图 所 示 ， 
存活 对 象 集 的 大 小 随时 间 不 断 增长 ， 而 堆 中 的 空闲 内 存 块 则 被 不 断 地 瓜分 。 








0 bytes 
12380 12:38:30 1230 12330 124000 12:40:30 124100 1241:30 124200 124230 
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12:3800 12:38:30 12:3300 12:39:30 124000 1240:30 124100 1241:30 124200 1242:30 








9.4” 自 定义 事件 


JRockit 提供 Java API 来 向 JFR 添加 自 定义 事件 。 相 关 接 口 在 com.oraclejrockit.jfr @ F, M 
于 rt.jar 中 ， 随 JRockit JDK 一 起 发 行 。 


目前 com.oracle.jrockitjfr 包 下 的 API 还 在 开发 中 ， 还 不 能 支持 已 经 发 行 的 
Oracle JRockit。 不 过 某 些 内 部 产品 (例如 WebLogic Server) 已 经 在 JFR 中 使 用 
该 API 了 。 


若 要 添加 自 定 义 事件 ,首先 要 确定 事件 的 类 型 。 在 本 章 的 开始 部 分 兽 经 介绍 过 共有 4 种 主要 
的 事件 类 型 。 依 据 具 体 的 需求 ， 需 要 扩展 不 同 的 事件 类 : 


口 com.oracle.jrockit.jfr.InstantEvent 








口 com.oracle.jrockit.jfr.DurationEvent 





口 com.oracle.jrockit.jfr.TimedEvent 








口 com.oracle. D JEE eo 

事件 也 可 以 动态 创建 ， 这 部 分 内 容 将 在 后 面 介 

在 下 面 示例 中 , 会 创建 一 个 简单 的 事件 ， 日 志 服务 时 记录 。 按照 需求 ,我 们 需要 知道 
调用 日 志 服 务 的 持续 时 间 ， 因此 选择 计时 事件 类 型。 此 外 ,还 需要 设置 一 个 病 值 ， 只 有 当 持 续 时 
间 超 过 该 闵 值 时 ， 才 会 被 记录 。 

创建 事件 的 代码 很 简单 ， 如 下 所 示 : 


import com.oracle.jrockit.jfr.EventDefinition; 
import com.oracle.jrockit.jfr.TimedEvent; 
import com.oracle.jrockit.jfr.ValueDefinition; 


@EventDefinition(name = "logentry") 
public class LogEvent extends TimedEvent { 
@ValueDefinition(name = "message") 


private String text; 


public LogEvent (String text) { 
this.text = text; 
} 
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public String getText() { 
return text; 
} 
} 


在 Java 应 用 程序 中 使 用 时 ， 只 需 创建 一 个 事件 实例 ， 以 下 面 的 形式 来 调用 : 


public synchronized void log(String text) { 
LogEvent event = new LogEvent (text); 
event .begin(); 
// 打印 日 志 
event.end(); 
event .commit (); 














} 
但 在 使 用 事件 之 前 ， 还 需要 创建 并 注册 一 个 事件 生成 器 : 


private static Producer registerProducer() { 
try { 

Producer p; 

p = new Producer("Log Producer (Demo)", 
"A demo event producer for the demo logger.", 
"http: //www.example.com/logdemo") ; 

p.addEvent (LogEvent.class); 

p.register(); 

return p; 

} catch (Exception e) { 
// 添加 异常 处 理 
e.printStackTrace(); 

} 

return null; 


} 











registerProducer 方法 返回 的 Producer 实例 在 事件 记录 过 程 中 都 需要 存在 。 








就 这 些 ， 大功告成 。 但是， 上 面 的 代码 执行 效率 很 差 。 每 次 创建 事件 实例 的 时 候 ， 都 会 隐 式 





地 查找 相关 联 的 事件 类 型 。 实 际 上 ， 如 果 在 创建 Producer 实例 的 时 候 能 够 传人 addEvent () 9 
方法 返回 的 事件 符号 ( EventToken )， 就 可 以 避免 重复 进行 全 局 查找 了 。 

















此 外 , 如 果 期 望 记 录 引 擎 能够 提供 调用 栈 信息 和 线程 信息 , 则 可 以 将 代码 修改 为 下 面 的 样子 : 


import com.oracle.jrockit.jfr.EventDefinition; 
import com.oracle.jrockit.jfr.EventToken; 
import com.oracle.jrockit.jfr.TimedEvent; 
import com.oracle.jrockit.jfr.ValueDefinition; 


@EventDefinition(path = "log/logentry", name = "Log Entry", 
description = "A log call in the custom logger.", 
stacktrace = true, thread = true) 

public class LogEvent extends TimedEvent { 
@ValueDefinition(name = "Message", description = 

"The logged message.") 
private String text; 


public LogEvent (EventToken eventToken, String text) { 
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super (eventToken) ; 
this.text = text; 
} 


public String getText() { 
return text; 
} 
} 


因此 ， 在 注册 事件 生成 器 时 ， 需 要 将 引用 保存 下 来 : 


static EventToken token; 
static Producer producer; 





static { 
registerProducer(); 


} 


static void registerProducer() { 
try { 
producer = new Producer("Log Producer (Demo)", 
"A demo event producer for the demo logger.", 
"http: //www.example.com/logdemo") ; 
token = producer.addEvent (LogEvent.class) ; 
producer.register(); 
} catch (Exception e) { 
/ /添加 异常 处 理 


e.printStackTrace(); 


} 
事件 符号 的 使 用 方式 如 下 所 示 : 


public synchronized void log(String text) { 
LogEvent event = new LogEvent (token, text); 
event .begin(); 
// 打 印 日 志 
event.end(); 
event .commit(); 


} 
此 外 ， 如 果 能 保证 事件 的 应 用 程序 场景 是 线程 安全 的 ， 则 可 以 将 text 属性 置 为 可 写 的 ， 对 
事件 实例 的 存储 和 重用 可 以 改 为 如 下 形式 : 


private LogEvent event = new LogEvent (token) ; 























TH 
如 





public synchronized void log(String text) { 
event .reset ();// 清 理 日 志 事件 内 容 ， 以 便 重 用 日 志 事 件 实 例 
event .SetText (text); 
event .begin(); 
// 打 印 日 志 
event.end(); 
event .commit(); 
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默认 情况 下 ， 事 件 是 禁用 的 。 若 要 启动 事件 记录 ， 需 要 在 使 用 的 模板 中 将 之 开启 。 此 外 ,还 
可 以 通过 编程 的 方式 来 启用 , 创建 一 个 带 有 已 启用 事件 的 记录 即 可 。 下 面 的 代码 展示 了 如 何 创建 
记录 ， 并 在 其 中 启用 事件 : 


FlightRecorderClient fr = new FlightRecorderClient(); 
FlightRecordingClient rec = fr.createRecordingObject ("tmp"); 






































for (CompositeData pd : fr.getProducers() ) 


{ 
if (!PRODUCER_URI.equals(pd.get("uri"))) { 


continue; 
} 
CompositeData events[] = (CompositeData[]) pd.get ("events"); 
for (CompositeData d : events) { 

int id = (Integer) d.get("id"); 


rec.setEventEnabled(id, true); 
rec.setStackTraceEnabled(id, true); 
rec.setThreshold(id, 200); 

rec.setPeriod(id, 5); 

System.out.printin("Enabled event " + d.get("name")); 


rec.close(); 


9.5 扩展 JFR 








JFR 中 包含 了 一 个 GUI 构建 工 
助 下 ，JRockit Mission Control 团队 


并 


,用 以 修改 和 扩展 JFR 界面 , 或 添加 新 功能 。 在 该 功能 的 帮 
以 加 快 开发 进度 ， 将 更 多 的 事件 用 于 开发 功能 和 修复 故障 。 





=>) 
qT 


当前 的 GUI 构建 工具 由 JRockit Mission Control 团队 设计 ， 就 Oracle 内 部 使 

用 来 说 ， 已 经 是 足够 了 。 因 此 ， 在 了 28/4.0 版 本 中 并 不 支持 该 构建 工具 。 寺 万 慎 

重 ， 若 要 使 用 ， 风 险 自 负 。 将 来 某 个 版 本 可 能 会 对 GUI 构建 工具 提供 支持 ， 但 
具体 日 期 还 未 确定 。 


尽管 并 不 支持 使 用 GUI 构建 工具 ， 在 修改 用 户 界面 的 时 候 ， 它 还 是 很 有 用 的 。 此 外 ， 还 可 
以 将 之 用 于 为 自 定 义 事件 生成 器 添加 自 定义 标签 页 。 该 工具 最 棒 的 地 方 就 是 , 可 以 在 用 户 界面 直 
接 将 定制 内 容 导出 , 以 便 在 同事 之 间 共 享 , 只 需要 将 插件 包 放 到 IROCKIT_HOME/missioncontrol/ 
plug-in 目录 下 即 可 。 

车 想 访 问 GUI 构建 工具 ,必须 在 启动 JRockit 的 时 候 添加 -designer 参数 :JROCKIT_HOME 
bin\jrmc -designero 

这 样 ， 将 在 Window | Show View 菜单 下 启用 Designer View 视图 ， 默 认 情 况 下 ， 该 视图 与 
JVM Browser 和 Event Types 在 同一 个 视图 文件 夹 下 。 











A 
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打开 某 个 记录 后 ， 可 以 在 Designer View 中 切换 设计 模式 和 运行 模式 。 

处 于 运行 模式 时 , 可 执行 的 操作 只 有 终止 记录 并 切换 到 设计 模式 。 单 击 红 色 的 终止 按钮 力 即 可 。 

当 处 于 设计 模式 时 , 可 以 修改 JFR 中 用 户 界面 的 任意 部 分 , 甚至 是 JFR 自身 的 标签 页 。 这 个 
功能 相当 强大 ， 当 然 ， 使 用 不 当 的 话 可 能 会 搞 乱 JER。 幸 和 运 的 是 ,用户 界 面 中 有 重 置 按钮 可 以 将 
用 户 界面 恢复 至 出 厂 设 置 。 该 重 置 按钮 位 于 Window | Preferences 菜单 下 。 









































通过 GUI 来 恢复 至 出 厂 设 置 这 个 功能 只 存在 于 JRockit Mission Control 4.0.1 
及 其 后 的 版 本 中 。 在 4.0.0 版 本 中 ， 可 以 通过 清空 <user.home>/.jrmc 文件 下 的 内 
容 来 实现 ， 但 不 幸 的 是 ， 这 个 方法 还 会 将 其 他 的 自 定义 设置 一 并 清空 。 


在 修改 完成 后 ， 点 击 Play 按钮 共 | 来 查看 运行 起 来 后 的 实际 样子 。 若 想 添加 新 的 标签 页 和 标 
签 页 组 ， 必 须要 先 关闭 记录 ， 因 为 这 会 修改 标签 页 的 存储 结构 。 

若 想 添加 一 个 标签 组 ， 右 键 单 击 根 节点 ， 在 上 下 文 菜 单 中 选择 New | New Group. 

弹出 的 对 话 框 中 ， 属 性 位 置 路 径 用 于 指定 标签 组 会 出 现在 工具 栏 的 什么 位 置 。 另 外 ,还 需要 
为 插件 选择 两 个 图 标 文件 。 

选择 标签 组 后 ， 右 键 单 击 该 标签 组 ， 选 择 New | New Tab 菜单 来 创建 新 标签 页 。 

若 要 调整 新 创建 的 标签 页 ， 首 先 要 载 和 人 包含 目标 事件 类 型 的 记录 。 作 为 示例 , 在 下 面 的 内 容 
中 ， 会 创建 一 个 新 的 标签 页 来 检测 JVM 中 已 分 配 的 内 存 总 量 。 

首先 , 进入 标签 页 设计 模式 。 目前 还 是 空白 的 , 因此 在 左上 角 会 显示 Unknown Component. 

现在 来 关注 一 下 标签 页 的 布局 。 在 顶端 设置 一 个 范围 选择 器 ， 在 其 下 方 添加 一 个 展示 图 。 

使 用 下 面 的 方法 可 以 添加 一 个 范围 选择 器 。 

(1) 右键 点 击 编辑 器 ， 选 择 Vertically Split 菜单 将 其 垂直 切 分 。 

(2) 在 设计 视图 中 使 用 滑 块 来 将 顶部 区 域 的 最 大 值 和 最 小 值 均 设置 为 100 像素 。 所 有 范围 选 
择 器 的 高 度 都 是 100 像素 。 

接 下 来 ， 在 范围 选择 器 的 下 方 添加 一 个 展示 图 。 右 键 单 击 该 区 域 ， 选 择 Assign Component 
| Graphics | Chart 菜单 ， 打 开展 示 图 配置 对 话 框 ， 在 其 中 添加 相关 属性 。 

(1) 选择 使 用 哪个 坐标 轴 来 关联 目标 属性 。 在 本 例 中 ,选择 Left Y Axis. 

(2) 选择 Data Series 标签 页 来 设置 要 显示 的 数据 线 。 

(3) 点击 Add. . . 按钮 打开 属性 浏览 器 对 话 框 。 对 于 4.0.0 版 本 的 JRockit Mission Control 来 说 ， 
会 以 平 铺 的 形式 列 出 所 有 事件 类 型 的 所 有 属性 。 

(4) 选择 目标 属性 。 在 本 例 ， 选 择 Allocated by All Threads 和 Total Allocated 属性 。 

大 功 告 成 。 当 然 , 还 可 以 通过 其 他 选项 使 展示 图 看 起 来 更 好 一 些 ， 比 如 坐标 轴 的 内 容 类 型 数 
据 线 的 颜色 或 为 坐标 轴 取 个 名 字 。 

在 自 定义 标签 页 中 创建 范围 选择 器 会 稍微 复杂 一 点 。 首 先 在 上 下 文 菜单 中 选择 Assign 
Component | Other | Range Selector， 打 开 属 性 编辑 对 话 框 。 
在 新 打开 的 对 话 框 中 ， 可 以 配置 范围 选择 器 的 相关 属性 。 由 于 范围 选择 器 中 包含 了 展示 图 ， 
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TEACH EIEE ANAS. WR ae Ae LAN TE PE aS Afi PERS, 则 必须 为 
每 个 坐标 轴 取 消 色 选 Show Tick Marks 复 选 枉 和 AxisVisible 复 选 框 。 

接 下 来 ， 为 事件 类 型 添加 duration 属性 ， 以 便 显 示 正 在 发 生 的 事件 数量 。 将 Style 属性 设置 
为 Integrating Point Density。 在 范围 选择 需 中 ,事件 属性 分 为 两 大 类 ， 以 不 同 颜色 显示 ， 分 别 是 
在 操作 集中 的 和 不 在 操作 集中 的 。 当 标签 页 中 的 事件 被 包含 在 操作 集 时 ， 就 能 够 看 到 可 视 化 的 反 
馈 内 容 了 。 因 此 需要 分 别 为 在 操作 集 和 不 在 操作 集中 各 设置 添加 属性 一 次 。 


当然 ， 想 知道 如 何 使 用 JFR 中 的 其 他 组 件 ， 最 简单 的 方法 就 是 进入 设计 模 
> 式 来 查看 其 他 组 件 在 JFR 中 是 如 何 使 用 的 。 


若 想 将 新 设计 的 标签 页 导出 到 插件 中 以 便 分 享 给 他 人 使 用 , 需要 先 关 闭 这 个 标签 页 , 重新 显 
示 出 标签 页 的 树 形 结构 。 

右键 单 击 根 节点 ， 选 择 Export UI | Plug-in 菜单 ， 打 开 Selection Needed 对 话 框 。 

正常 情况 下 ， 只 有 那些 已 修改 或 新 增 的 标签 页 会 被 选中 。 这 里 需要 注意 的 是 ， 因 增加 新 功能 
而 发 布 新 版 本 时 ， 应 该 永远 增加 插件 的 版 本 号 ， 否 则 会 被 旧版 本 覆盖 掉 。 

点 击 OK 按钮 后 ， 就 可 以 将 插件 保存 为 一 个 jar 文件 了 。 

保存 之 后 的 插件 包 就 可 以 以 更 新 站 点 的 形式 共享 给 同事 朋友 了 ， 当 然 ， 直 接 将 插件 包 放 到 
JROCKIT HOME/missioncontrol 目录 下 也 是 可 以 的 。 








































































































9.6 小 结 


本 章 着 重 介绍 了 JRockit Flight Recorder， 包 括 新 的 数据 模型 、 事 件 的 概念 、 数 据 生 成 过 程 ， 
以 及 如 何 使 用 JFR 进行 记录 。 此 外 , 还 展示 了 JER 中 的 一 些 高 级 概念 , 例如 如 何 控 制 事件 类 型 的 
启用 和 相关 属性 。 接 下 来 ， 还 介绍 了 JFR A IRA PULA I: 
O 新 的 范围 选择 器 
口 新 的 事件 类 型 
O 操作 集 的 修改 
口 关联 键 
口 在 JFR 中 做 延迟 分 析 
口 内 存 相关 标签 页 的 修改 
接着 ,介绍 了 如 何 通 过 JRockit 中 的 标准 Java API 来 扩展 JFR， 实 现 自 定义 事件 。 
最 后 ,介绍 了 如 何 使 用 设计 模式 来 扩展 FR， 以 及 如 何 导 出 自 定义 的 插件 。 
下 一 章 将 会 介绍 如 何 使 用 JRockit Mission Control Memory Leak Detection Tool 来 追查 应 用 程 
序 的 内 存 泄漏 问题 。 









































Memory Leak Detector 








正如 第 3 章 中 介绍 的 ，Java 运行 时 为 开发 人 员 提 供 了 非常 简单 的 内 存 模型 , 使 开发 人 员 无 须 
为 存储 数据 而 向 操作 系统 申请 内 存 ， 也 无 须 为 回收 内 存 而 操心 。 

带 有 垃圾 回收 的 编程 语言 往往 会 使 人 误 以 为 “不 需要 做 资源 管理 ， 内 存 泄漏 不 会 发 生 ”。 可 
惜 事 与 愿 违 ， 在 生产 环境 中 ,使 用 Java 写 出 内 存 泄漏 程序 的 例子 不 计 其 数 ， 以 至 于 不 少 系统 都 
是 靠 定 时 重启 来 维持 运转 的 。 

本 章 的 主要 内 容 包 括 : 

O Java 中 内 存 泄漏 的 含义 
口 如 何 检 测 内 存 泄漏 
口 如 何 通过 JRockit Memory Leak Detector 排查 内 存 泄漏 的 根源 



























































10.1 Java 内 存 泄漏 


应 用 程序 中 已 经 分 配 出 去 的 内 存 不 再 使 用 后 , 就 应 该 归还 给 系统 。Java 自身 带 有 垃圾 回收 器 ， 
与 C 语 言 这 类 静态 编程 语言 差别 较 大 ，Java 使 开发 人 员 无 须 再 显 式 地 释放 内 存 。 但 实际 情况 是 ， 
如 果 无 用 内 存 没有 被 归还 给 系统 的 话 ， 仍 然 会 产生 内 存 泄漏 ， 最 终 使 系统 因 内 存 不 足 而 崩溃 。 


10.1.1 静态 编程 语言 中 的 内 存 泄漏 


在 静态 语言 中 , 内 存 管理 本 身 比 释放 内 存 更 复杂 一 些 ,， 因为 必须 要 确保 释放 内 存 的 操作 不 会 
使 应 用 程序 崩溃 。 在 没有 自动 内 存 管 理 的 年 代 , 这 并 不 容易 。 假 设 有 某 个 服务 是 用 于 获取 地 址 记 
录 的 ， 出 于 效率 考虑 ， 地 址 记录 都 是 放 在 内 存 中 的 。 如 果 模 块 A、B 和 C 都 会 使 用 该 服务 ， 则 它 
们 可 能 会 并 发 地 引用 同一 个 地 址 记录 。 

如 果 某 个 模块 在 完成 工作 后 , 就 释放 了 地 址 记录 所 占用 的 内 存 , 则 其 他 正在 使 用 该 地 址 记录 
的 模块 就 会 操作 失败 ， 导致 应 用 程序 崩 演 。 因 此 ， 在 分 配 和 释放 内 存 时 ,必须 要 有 明确 严格 的 规 
范 , 并且 最 好 能 使 服务 知晓 某 个 模块 已 经 完成 针对 某 个 地 址 记录 的 操作 。 就 本 例 来 说 ,各 个 模块 
是 不 可 以 显 式 释放 地 址 记录 的 内 存 的 。 解决 方法 是 在 地 址 记录 上 实现 类 似 引 用 计数 的 结构 ,以 保 
证 在 所 有 模块 都 完成 操作 后 再 释放 内 存 。 不过, 这 种 方式 需要 用 到 同步 锁 ， 而 且 增 加 了 系统 的 复 
杂 性 。 有 时 候 ， 为 了 简化 系统 ， 开 发 人 员 不 得 不 自己 实现 一 套 垃圾 回收 顺 。 
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10.1.2 ”自动 内 存 管 理 中 的 内 存 泄漏 


使 用 Java 或 其 他 具有 垃圾 回收 功能 的 编程 语言 时 ， 开 发 人 员 再 也 不 用 操心 复杂 的 内 存 管 理 
了 ,垃圾 回收 融会 完成 内 存 回 收工 作 的 。 以 之 前 的 示例 来 说 ， 若 某 个 地 址 记录 已 经 无 用 了 ， 则 垃 
圾 回收 器 会 负责 将 其 所 占用 的 内 存 空间 回收 。 但 即便 如 此 , 还 是 有 可 能 会 产生 内 存 泄漏 的 ， 即 在 
对 象 已 经 无 用 之 后 ， 仍 处 于 存活 状态 。 

内 存 汽 漏 指 的 是 无 意 中 持 有 无 用 对 象 (unintentional object retention )， 这 个 名 字 真 的 是 名 副 
其 实 。 一 个 示例 是 , 由 于 引用 了 无 用 对 象 而 造成 了 内 存 泄漏 ， 而 造成 这 种 情况 的 原因 可 就 千 奇 百 
怪 了 。 

例如 , 将 对 象 引用 放 到 缓存 中 , 却 在 对 象 无 用 之 后 忘记 从 缓存 中 清除 了 。 如 果 开 发 人 员 无 法 
完全 掌控 对 象 的 生命 周期 ， 则 可 以 使 用 基于 弱 引 用 的 内 存 管理 策略 ， 如 使 用 java.util. 
WeakHashMap 来 缓存 对 象 引用 。 







































































GS 千 万 小 心 , 弱 引用 不 是 万 能 的 ,不 能 消除 所 有 因 缓 存 而 引发 的 内 存 泄漏 问题 。 
开发 人 员 误 用 弱 引 用 相关 的 集合 类 也 有 可 能 造成 内 存 泄 漏 。 








在 像 NEE 服务 器 这 样 的 应 用 程序 容器 中 ， 可 能 会 同时 存在 多 个 类 载 人 器 ， 因 此 需要 特别 
小 心 那些 不 是 因 框 架 依 赖 被 载 人 进来 而 后 又 被 遗忘 的 类 。 这 种 情况 往往 出 现在 重新 部 署 应 用 程 
序 时 。 


10.2 ”检测 Java 中 的 内 存 泄漏 


JVM AI outofMemoryError 崩溃 时 ， 往 往 是 内 存 汽 漏 导致 的 。 在 发 布 一 款 Java 产品 之 前 ， 
通常 应 该 测试 产品 是 否 有 内 存 泄漏 问题 。 在 标准 的 测试 用 例 中 , 应 该 让 应 用 程序 持续 运行 一 段 时 
间 , 并 检测 堆 中 存活 对 象 的 数量 来 判断 是 否 存 在 内 存 泄漏 。 良 好 的 测试 程序 应 该 会 自动 、 定 期 对 
产品 进行 内 存 泄漏 测试 。 


















































在 开发 JRockit Mission Control 4.0.0 版 本 时 , 开发 团队 犯 了 过 度 自信 的 错误 。 
正常 情况 下 ， 在 最 终 测 试 的 时 候 ， 应 该 会 使 用 Memory Leak Detector 工具 来 检 
Æ JRockit Mission Control 中 的 编辑 器 是 否 被 正常 回收 了 。 在 那 之 前 ， 这 项 测试 
<= selina ice gl ora a oe oun anh gs 
& & Memleak 编辑 器 时 ， 都 会 使 一 个 编辑 器 对 象 成 为 内 存 汇 漏 的 组 成 部 分 
然 ， 这 个 问题 现在 已 经 通过 Memory Leak Detector 解决 了 。 


Java 中 的 内 存 泄漏 问题 可 以 通过 Management Console 查看 存活 对 象 集 属 性 ( live set attribute ) 
来 判断 。 但 需要 明确 的 是 , 短 时 间 内 ， 存 活 对 象 集 的 数量 不 断 上 升 并 不 一 定 是 因为 内 存 泄漏 ， 而 
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可 能 是 因为 Java 应 用 程序 的 负载 发 生 了 变化 ， 使 应 用 程序 消耗 了 更 多 内 存 ， 例 如 并 发 的 用 户 数 

增加 了 。 但 如 果 存 活 对 象 集中 对 象 的 数量 持续 增加 ， 则 很 有 可 能 是 出 现 内 存 泄漏 了 。 

对 堆 中 对 象 做 详细 分 析 主 要 有 两 种 方式 。 
口 在 线 堆 分 析 。 这 需要 用 到 JRockit Memory Leak Detector. 
O 离线 堆 分 析 。 需 要 先 将 堆 中 内 容 转 储 。 

对 于 在 线 分 析 来 说 ， 趋 势 分 析 (trend analysis ) 数据 由 垃圾 回收 需 提 供 。 由 于 垃圾 回收 顺 在 
垃圾 回收 的 标记 过 程 中 就 会 遍历 堆 中 所 有 的 存活 对 象 , 提供 趋势 分 析 数 据 并 不 会 带 来 太 大 的 性 能 
损耗 ， 而 其 生成 的 对 象 图 谱 则 是 分 析 内 存 分 配 趋势 的 重要 数据 。 






























































JRockit 使 用 的 对 转 储 格式 是 HPROF, 与 使 用 JVMTI( Java virtual machine tool 
interface ) 中 指定 的 堆 转 储 格式 相同 。 因 此 ， 由 JRockit 生成 的 堆 转 储 可 以 使 用 任何 
支持 HPROF 格式 的 工具 进行 分 析 。 更 多 有 关 HPROF 格式 的 内 容 , 请 参见 JRockit 
> JDK 的 相关 示例 ， 具 体位 置 在 ROCKIT _ HOME/demo/jvmti/hprof/src/manual.html， 
AK JVMTI 的 内 容 ， 请 参见 IDK 的 相关 文档 http://java.sun.com/javase/6/docs/ 
platform/jvmti/jvmti.html。 


10.3. Memleak 简介 


Memleak ( JRockit mission control memory leak detector ) 可 以 动态 地 连接 到 运行 中 的 JRockit 
实例 ， 追 踪 Java 运行 时 的 内 存 变化 ， 找 出 某 种 类 型 的 所 有 实例 ， 以 及 各 个 对 象 的 引用 关系 。 此 
外 ， 它 还 可 以 追踪 某 种 类 型 的 对 象 分 配 操作 。 这 些 功 能 听 起 来 挺 复 杂 ， 实际 上 都 简明 易 用 。 在 介 
绍 如 何 使 用 Memleak 解决 内 存 泄漏 问题 之 前 ， 还 需要 简单 介绍 Memleak 的 特性 。 

口 趋势 分 析 的 执行 开销 非常 小 。 在 垃圾 回收 的 标记 过 程 中 ， 会 收集 对 象 之 间 的 引用 信息 。 
正如 之 前 提 到 的 ， 这 个 操作 的 执行 时 间 会 非常 短 。 在 运行 Memleak 的 过 程 中 ， 每 次 执行 
垃圾 回收 时 ， 都 会 收集 必要 的 数据 。 为 了 保证 数据 的 及 时 性 ， 默 认 情 况 下 ， 若 应 用 程序 
没有 触发 正常 的 垃圾 回收 , 则 Memleak 会 每 10 秒 钟 触 发 一 次 垃圾 回收 操作 。 在 Memleak 
的 配置 选项 中 可 以 配置 此 时 间 间 隔 ， 这 大 大 降低 了 工具 对 应 用 程序 的 侵入 性 。 

O 执行 内 存 分 析 时 ， 可 以 无 视 客户 端 硬件 。 通 过 一 台 手 提 电 脑 就 可 以 连接 到 拥有 数 兆 字 节 
堆 内 存 的 服务 器 进行 分 析 。 
口 可 以 实时 观测 到 事件 和 堆 的 变化 。 这 是 把 双 刃 剑 。 它 可 以 与 应 用 程序 交互 ， 例 如 观察 
用 程序 的 哪些 操作 会 导致 哪些 内 存 变化 ， 在 操作 某 个 对 象 的 同时 观察 e 
不 过 ， IEA, 本 已 被 应 用 程序 废弃 的 数据 对 象 ， 却 无 法 被 垃圾 回收 器 回收 掉 。 
口 无 法 进行 离线 分 析 。 如 果 没 有 权限 对 正在 运行 的 应 用 程序 进行 在 线 分 析 的 话 ， 那 会 是 个 
问题 。 JRockit R28 可 以 生成 标准 的 HPROF 格式 的 堆 转 储 文件 ,这样 就 角 
通过 其 他 分 析 工 具 ( 例如 Eclipse MAT ) 进行 离线 分 析 了 。 
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GS 注意 ，HPROF 格式 的 堆 转 储 文件 中 包含 了 堆 的 全 部 内 容 ， 如 果 堆 中 包含 有 
敏感 数据 ， 则 一 定 要 小 心 处 理 堆 转 储 文件 ， 防 止 机 密 信 息 外 汇 。 


10.4 ”追踪 内 存 泄漏 


排查 内 存 泄漏 问题 是 个 技术 活 儿 , 通常 会 交叉 使 用 多 种 工具 和 技术 。 有 时 候 , 应 用 程序 会 
外 持 有 无 用 对 象 的 引用 , 而 且 若 被 泄漏 的 内 存 分 别 在 不 同 的 地 方 分 配 和 持 有 ， MEERA 
困难 ， 因 此 需要 详细 分 析 才 能 找到 内 存 泄漏 的 真正 根源 。 

若 想 启动 Memleak， 只 需 在 JRockit Mission Control 的 JVM 浏览 器 视图 中 ， 右 键 点 击 目标 
JVM,， 选 择 Memleak 即 可 。 


| 同一 时 间 ， 只 能 有 一 个 Memleak 连接 到 目标 JVM 上 。 ] 


在 Memleak 中 ， 趋 势 表 (trend table) 可 用 于 检测 是 否 有 潜在 的 内 存 泄漏 ， 具 体 是 通过 定 
期 构建 应 用 程序 中 各 类 型 对 象 实例 数量 的 直方 图 ， 再 经 过 对 比 判断 来 实现 的 。 针 对 各 类 型 实例 
所 占用 内 存 做 最 小 二 乘 逼 近 (least squares approximation )， 并 以 “ 字 节 / 秒 ” 为 单位 显示 内 存 增 
长 率 。 






















































































在 JRockit Mission Control 4.1.0 版 本 中 ， 该 算法 会 相对 复杂 一 点 ， 它 需要 整 
合 存 活 对 象 集 的 数量 。 若 某 些 类 型 的 实例 数量 与 存活 对 象 集 的 增长 曲线 相 匹配 ， 
增长 率 很 高 ， 则 很 可 能 是 在 这 些 类 型 上 出 现 了 内 存 泄 漏 。 





趋势 表 常 用 于 查找 内 存 泄漏 的 根源 。 在 趋势 表 中 , 增长 率 很 高 的 类 均 以 红色 显示 。 趋 势 表 还 
可 以 显示 出 相关 实例 的 数量 和 占用 的 内 存 数量 。 

从 下 图 中 可 以 看 出 , 很 有 可 能 是 字符 数组 发 生 了 内 存 泄 漏 。 在 下 面 的 截图 中 , 字符 数组 以 深 
色 表 示 ， 处 于 趋势 表 的 顶部 ， 增 长 率 位 居 首 位 。 
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此 外 ，LeaksDemoobject 和 Hashtable 类 型 的 实例 也 正 发 生 内 存 泄漏 ， 只 不 过 严重 程度 
稍 低 而 已 。 
总 体 来 看 ， 内 存 汇 漏 的 速率 为 7.5 KB/s. 


(6.57*1,024+512+307+71+53+11)/1,024 = 7.5 


JVM 堆 的 最 大 值 为 256 MB ， 已 使 用 的 存活 对 象 集 为 20 MB (该 数值 可 以 在 Management 
Console 中 查 到 )。 


(256 - 20) *1,024 / 7.5 ~ 32,222 seconds ~ 537 minutes ~ 22 hours 


照 此 下 去 ,在 22 小 时 后 ， 应 用 程序 就 会 因 outofMemoryError $R mM AAT o 

看 来 还 有 一 段 时 间 可 用 来 查找 内 存 泄漏 的 根源 。 右键 点 击 趋势 表 中 的 字符 数组 , 选择 Add to 
Type Graph 菜单 。 

这 样 ， 就 会 将 字符 数组 类 型 加 入 类 型 图 标签 页 ,并 自动 切换 到 该 标签 页 。 类 型 图 标签 页 并 不 
显示 类 型 的 继承 关系 图 ， 而 是 显示 实例 之 间 的 引用 关系 图 ， 并 且 只 会 显示 被 选中 的 类 型 的 实例 。 

点 击 类 型 名 左 侧 的 绿色 加 号 项 , 会 显示 出 有 哪些 类 型 包含 指向 该 类 型 的 引用 , 称 为 扩展 节点 
( expanding the node )。 每 次 点 击 类 型 名 左 侧 的 加 号 都 会 扩展 出 其 他 几 个 节点 ， 其 中 包括 了 泄漏 内 
存 最 多 的 类 型 。 

与 趋势 表 类 似 ， 在 类 型 图 中 ， 增 长 过 快 的 类 型 也 以 深 红 色 表 示 。 

在 这 个 示例 中 ， 若 想 找 出 到 底 是 哪些 对 象 引 用 了 字符 数组 ， 则 需要 展开 字符 数组 节点 。 
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Use the context menu in another tab or view to add types here and see which other types refer to them. 






Q java.io.BufferedWriter 











char[] 
Growth rate: 6 718 (bytes/sec) 
Referring types: 12 

Referring types displayed: 5 
Instances: 49487 














A 
Q java.text.DigitList 























E] Trend Ea Type Graph | >=} Type Tree 画 Instance Graph i) Instance Tree Fy Allocation 


展开 字符 数组 后 ， 只 有 一 种 类 型 是 疑似 内 存 泄漏 的 ， 即 Leak 类 的 内 部 类 Demoobject。 
继续 展开 Leak$DemoObject 类 及 其 展开 的 子 类 型 ,直到 发 现 应 用 程序 可 能 在 小 用 Hashtable 























类 。 

















接 下 来 ， 需 要 找 出 到 底 是 哪个 Hashtable 对 象 被 误 用 了 。 这 有 多 种 实现 方法 。 在 本 例 中 ， 
由 于 基本 确定 了 LeakSDemoObject 发 生 了 内 存 泄 漏 , 只 需要 列 出 有 哪些 Hashtable$Entry 类 
的 实例 指向 LeakSDemoObject 实例 即 可 。 








Java 中 的 内 部 类 (例如 Hashtable 类 中 的 Entry 类 ) 在 字 节 码 中 是 以 
OuterClass$InnerClass 这 种 格式 命名 的 ， 在 分 析 工 具 中 显示 的 就 是 这 种 格 


| 式 的 类 名 , EAB PH HashtablesEntry fe LeakSDemoObject, X# AA Sun 








公司 在 为 Java 语言 引 入 内 部 类 的 时 候 ， 并 不 想 修 改 JVM 规范 ， 因 此 就 在 类 型 名 
上 做 了 调整 。 


若 想 列 出 具有 特殊 关联 关系 的 实例 ， 只 需 右 键 点 击 关联 关系 ,选择 List Referring Instances 
菜单 即 可 。 

这 样 ， 就 会 在 Memleak 编辑 器 左 侧 打开 实例 视图 (instance view )， 在 其 中 列 出 指向 
Leak$Demo0bject 实例 的 HashtablesEntry 实例 。 右键 点 击 其 中 某 个 实例 , 选择 Add to Instance 
Graph 菜单 ,可 以 将 该 实例 添加 到 对 象 图 中 。 这 时 会 显示 出 一 个 类 似 于 类 型 图 的 图 像 ， 只 不 过 其 
内 容 是 各 个 实例 之 间 的 引用 关系 。 

在 有 了 Instance Graph 之 后 ， 接 下 来 就 是 要 找 出 到 底 是 哪些 对 象 引 用 了 这 些 无 用 实例 。 在 
之 前 版 本 的 Memleak 中 ， 这 并 不 容易 ， 尤 其 是 当 对 象 的 引用 关系 非常 复杂 时 ， 那 简直 是 一 场 灾 
难 。 到 JRockit Mission Control 4.0.0 时 ， 就 可 以 通过 可 选 菜单 来 使 TRockit 自动 查找 某 个 对 象 到 根 
引用 (root referrer) 的 完整 路 径 了 。 只 需 右键 单 击 目标 实例 ， 选 择 Expand to Root 菜单 ， 即 可 
显示 出 对 该 实例 的 完整 引用 路 径 。 如 下 图 所 示 。 
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Use the context menu in another tab or view to add instances here and see which other instances refer to them. 


|) java.util. Hashtable$Entry<0> 
Expand To Root N 
Expand All Nodes 








Inspect Instance 
With type > 
Zoom to selected 


Remove 


(XP ogi Yt 




















E Trend |[5=] Type Graph [5:] Type Tree | [a] Instance Graph Instance Tree | L Allocation 


正如 截图 所 示 , 在 展开 的 节点 中 可 以 看 到 , 有 一 个 名 为 Main Thread 的 线程 持 有 对 Hashtable 
类 的 实例 的 引用 。 
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Use the context menu in another tab or view to add instances here and see which other instances refer to them. 


Q Leak$DemoThread<250> Q java.util.Hashtable<251> 


a] m 
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Threadroot: Thread-2 +} java.util Hashtable$Entry{]<2¢ 
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当 通 过 Eclipse 运行 JRockit Mission Control 时 ， 可 以 右键 单 击 Leak$Demoobject 9A, M 
上 下 文 菜单 中 选择 View Type Source 菜单 来 查看 相应 的 代码 。 在 本 例 中 ， 代 码 如 下 : 


for (int i = 0; i <= 100; i++) { 
put (total + i); 





} 


for (ant. i = 0p i TOO iF) 4 
remove (total + i); 


} 


在 这 两 个 循环 中 ，remove 方法 所 移 除 的 对 象 少 于 put 方法 所 加 入 的 对 象 , 从 而 造成 了 内 存 


| 本 章 中 所 使 用 到 的 示例 应 用 程序 可 以 在 随 书 代码 中 找到 。 


总 结 一 下 ， 追 查 内 存 泄漏 问题 有 以 下 4 个 要 点 。 
(1) 找到 那些 被 泄漏 的 实例 。 

(2) 找 出 这 些 对 象 的 引用 路 径 。 

(3) 噜 除 造 成 内 存 泄漏 的 引用 关系 。 
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(4) 如 果 还 有 内 存 泄漏 的 话 ， 从 (1) 开始 再 来 一 遍 。 

当然 ， 要 找 出 那些 被 泄漏 的 实例 并 非 易 事 。 方 法 之 一 就 是 只 追查 处 于 特殊 引用 关系 的 实例 。 
在 上 面 的 示例 中 ， 就 是 只 追查 被 Demoobject 类 所 引用 的 字符 数组 。 特 别 需 要 注意 的 是 泄漏 对 
象 和 非 泄漏 对 象 之 间 的 引用 关系 。 在 之 前 示例 的 类 型 图 中 ， 在 展开 Hastable$Entry 节点 后 可 
以 看 到 对 象 的 增长 率 其 实 很 正常 ， 因 此 内 存 泄漏 很 有 可 能 是 误 用 Hashtable 导致 的 。 
集合 类 很 容易 被 误 用 ， 进 而 造成 内 存 泄漏 。 很 多 集合 类 是 以 数组 实现 的 ， 如 果 不 能 正确 评估 
使 用 场景 , 则 很 有 可 能 会 使 数组 变 得 越 来 越 大 。 因此, 另 一 个 查找 内 存 泄漏 的 方法 就 是 列 出 系统 中 
占用 内 存 最 大 的 数组 , 例如 右键 单 击 Hashtable$Entry 数组 , 选择 List Largest Arrays 菜单 即 可 。 

如 果 这 两 种 方式 都 没有 用 , 那么 就 只 能 等 应 用 程序 再 多 运行 一 段 时 间 来 判断 了 , 随 着 应 用 程 
序 的 运行 ,会 有 更 多 的 内 存 被 无 法 释放 的 对 象 消耗 掉 。 

占用 内 存 最 大 的 两 个 HashTable$Entry 类 的 实例 , 就 是 内 存 泄漏 的 根源 。 将 其 中 的 一 个 添 
加 到 Instance Graph， 并 展开 其 引用 路 径 ， 可 以 看 到 LeaksDemoThread 类 的 table 属性 指向 
了 Hashtable 类 的 实例 。 


与 类 载 入 器 相关 的 信息 


在 下 面 的 示例 中 ， 共 有 3 个 类 载 人 器 来 运行 两 段 几 乎 完全 一 样 的 代码 ， 执 行 结果 是 ，!1 个 运 
行 正常 ，2 个 内 存 泄漏 。 这 个 例子 用 于 说 明 同 一 个 应 用 程序 的 不 同 版 本 在 运行 时 会 有 什么 区 别 。 
像 JRockit Mission Control 套件 中 的 其 他 工具 一 样 ， 充 分 挖掘 Memleak 中 展示 图 表 的 内 容 ， 可 以 
收获 很 多 有 用 的 信息 。 例如 , 通过 表 设 置 中 的 配置 , 可 以 看 到 类 载 人 器 的 相关 信息 。 如 下 图 所 示 。 
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默认 情况 下 , Memleak 是 在 一 行 中 显示 某 个 类 的 汇总 信息 。 若 想 区 别 显示 不 同类 加 载 器 下 类 
的 汇总 信息 ， 点 击 Individually show each loaded class 按钮 距 即 可 ， 就 在 刷新 按钮 的 旁边 。 

在 下 图 中 ， 列 出 了 类 名 中 含有 Demo 字符 串 的 类 ， 涉 及 3 种 不 同 的 类 载 和 器， 其 中 的 2 种 很 
有 可 能 出 现 了 内 存 泄漏 。 
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Which types are leaking? Ignoring types that occupy less than 0.0% of the heap. 
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Type Class Loader Class Loader... Growth Rate % of Heap Instances Size 

© Leak$DemoThread CustomLoader<3> 3 0 bytes/s 0,00% 1 152 bytes 

© Leak$DemoObject CustomLoader<2> 2 2,99% 10 878 424,92 kB 

© LeakSDemoThread CustomLoader<2> 2 0 bytes/s 0,00% 1 152 bytes 

@ Leak$DemoObject CustomLoader<0> 0 3,00% 10925 426,76 kB 

© Leak$DemoThread CustomLoader<0> 0 0 bytes/s 0.00% 1 152 bytes 
=| Trend | [E] Type Graph | [==] Type Tree | [£] Instance Graph | [ca] Instance Tree L, Allocation | 

















在 类 型 图 中 也 可 以 按照 类 载 人 器 分 开展 示 , 只 需 点 击 右 上 角 的 Use a separate node for each 
loaded class 按钮 图 | 即 可 。 分 开 之 后 ， 会 按照 不 同 的 类 载 人 器 分 别 显 示 引 用 了 字符 数组 的 类 型 ， 
其 中 类 名 后 括号 内 的 数字 就 是 类 载 人 器 ID. 

此 外 ， 点 击 右 上 角 的 Combine classes with same class name 按钮 风 ， 可 以 切换 回 只 针对 
类 的 汇总 信息 。 在 显示 样式 的 切换 时 ， 并 不 会 改变 当前 可 见 节点 的 任何 状态 ,只 会 对 还 未 展开 的 
节点 产生 影响 。 
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Memleak 还 可 以 用 来 验证 应 用 程序 中 的 内 存 管理 是 否 运转 正常 , 例如 验证 “从 联系 人 列表 中 
移 除 了 所 有 Contact 对 象 后 ， 系 统 中 已 经 就 不 存在 Contact 对 象 了 ”。Memleak 可 以 交互 式 运 
ÍT, 在 查找 内 存 泄漏 时 非常 有 用 ,对 于 交互 式 应 用 程序 来 说 更 是 如 此 , 免除 了 将 堆 转 储 到 本 地 文 
件 的 麻烦 。 只 要 小 心 仔细 些 ， 并 了 解 相 应 的 系统 知识 ， 排 查 内 存 泄漏 问题 就 会 轻松 愉快 。 

假设 现在 有 一 个 以 Swing 开发 的 地 址 短 应 用 程序 ， 主 类 是 AaqressBook， 其 中 包含 了 几 个 
内 部 类 ， 例 如 用 于 表示 联系 人 的 AddressBookScontact 类 ， 可 以 对 地 址 短 执 行 添 加 或 删除 联 
系 人 的 操作 。 现 在 ， 来 验证 一 下 该 应 用 程序 中 AddressBookSContact 类 的 实例 是 否 存在 内 存 
TD o 

正常 情况 下 ，Memleak 只 会 显示 那些 堆 内 存 使 用 率 达 到 0.1% 以 上 的 类 型 ， 和 否则 要 显示 出 的 
数据 就 太 多 了 。 对 于 那些 不 会 引发 内 存 泄漏 的 类 型 ， 不必 太 关心 ， 随 着 应 用 程序 的 不 断 运 行 ， 有 
问题 的 类 会 占用 越 来 越 多 的 堆 内 存 。 但是, 很 多 时 候 , 被 泄漏 的 内 存 只 会 占用 一 小 部 分 内 存 ， 等 
到 应 用 程序 运行 了 相当 长 的 一 段 时 间 后 , 才 会 变 得 明显 起 来 。 为 了 更 好 地 检测 内 存 泄漏 ,可 以 将 
可 报告 的 最 低 堆 使 用 率 设 为 0。 
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然后 过 滤 出 那些 想 要 测试 的 类 ， 观 察 其 在 应 用 程序 中 的 行为 变化 。 


regexp 前 组 来 输入 正则 表达 式 。 


| 在 第 7 章 中 曾经 介绍 过 ，JRockit Mission Control 中 的 过 小 框 可 以 通过 添加 


在 下 图 中 可 以 看 到 ， 从 addressBook 中 移 除了 3 个 地 址 ， 但 contact 实例 的 数量 却 没 有 
发 生变 化 。 
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SE This Mission Control 
© AddressBook sun.misc.LauncherSAppC... 0 O bytes/s 0,01% 1 440 bytes 
© AddressBookSContact sun.mise.LauncherSAppC... 0 O bytes/s 0,00% 8 128 bytes 
© AddressBooks sun.mise.LauncherSAppC.. 0 O bytes/s 0,00% 1 16 bytes 
© AddressBookSContactList sun.mise.LauncherSAppC... 0 0 bytes/s 0,00% 1 24 bytes 





Phone number 





Animal Control 555-X-TERM-N-8 
Ghostbusters 555-2368 


Grandma 555-0110 
[The White House 202-456-1414 


Tony Banks 555-GEN-ESIS 
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移 除 对 象 后 ，AddressBookscontact 实例 的 数量 却 没 有 变化 ， 说 明确 实 发 生 了 内 存 泄 漏 。 





< 
| Q 车 希望 Memleak 能 及 时 显示 出 堆 内 存 的 变化 ,可 以 将 趋势 表 的 剧 新 闻 隔 调 低 。 


由 于 所 有 的 Contact 实例 都 没有 被 回收 掉 ， 追 踪 其 中 任意 一 个 就 可 以 了 。 在 趋势 表 的 上 下 
文 菜单 中 点 击 List all instances ， 然 后 将 所 有 列 出 的 实例 添加 到 Instance Graph， 在 示例 中 ， 对 
象 到 根 引 用 的 路 径 显示 了 对 象 之 间 是 通过 名 为 numberTocontact 的 索引 映射 关联 起 来 的 ,该 应 
用 程序 的 开发 者 应 该 会 对 这 个 数据 结构 比较 熟悉 , 知道 该 去 哪里 找到 这 个 数据 结构 。 如 果 我 们 确 
保 从 索引 映射 和 联系 人 列表 中 移 除 Contact 对 象 ， 那 么 内 存 泄露 的 问题 应 该 就 不 复 存在 了 。 

内 存 泄漏 的 交互 式 测试 主要 包括 以 下 几 点 。 

(1) 建立 一 个 假设 ， 例 如 “关闭 Eclipse PHP Editor 后 ， 则 编辑 器 实例 以 及 与 其 关联 的 实例 都 
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应 该 被 回收 掉 了 ”。 
(2) 在 趋势 表 中 过 滤 出 目标 类 型 。 
(3) 观察 其 在 应 用 程序 中 的 行为 变化 。 
(4) 如 果 发 生 了 内 存 泄漏 ， 可 以 通过 对 象 的 引用 路 径 来 定位 内 存 泄漏 的 源头 。 


10.6 ”通用 堆 分 析 器 
Memleak 还 可 以 作为 通用 堆 分 析 器 使 用 。 在 Type 面板 中 会 显示 出 堆 中 的 类 之 间 的 引用 关系 。 


在 下 面 的 示例 中 ， 实 例 之 间 出 现 了 循环 引用 ，Hashtable$Entry 实例 指向 了 自身 ， 右键 单 击 引 
用 关系 上 的 数字 ， 选 择 List referring instances 菜单 即 可 显示 出 关联 关系 。 
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File Window Help 
EE NM Browser 3% Event Types | £1 instances ` O AT) UMO Djrockieqa .120115.15] Leak 21-0: 600) E3 ) 
Instances of prve.util HashtableSEntry pontang to pva.util Hash ~ 7 
DAD E Type Graph els | 
Instance Dateke.. | Type Graph RAAF SANS | 
jsvauGUHashtsbleSEntry<0> >99,89 kB Use the contest menu in another tab or view to add types here and see which other types refer to them. | 
java.util MashtableSEntry <1 > 297,70 kB 
java.util HachtablesEntry<2> »97,63 8 
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|i} java.util MashtableSEntey<5> 312 bytes 
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经 过 几 次 点 击 后 ， 就 可 以 找 出 系统 中 到 底 有 哪些 Hashtable 实例 指向 了 自身 ， 还 可 以 找 出 
他 们 在 系统 的 准确 位 置 。 选 择 某 个 实例 , 将 其 添加 到 Instance Graph,， 并 追踪 器 其 引用 路 径 ,， 于 
是 可 以 发 现在 com. sun.jmx.mbeanserver.RepositorySupport 类 中 用 到 了 该 实例 。 当 然 ， 
将 Hashtable 指向 Hashtable 本 身 并 没有 错 ， 这 里 只 是 作为 示例 讲解 一 下 而 已 。 


| 上 面 的 示例 需要 使 用 IDK 1.5 才能 看 到 ， 到 JDK 1.6 时， 就 已 经 改 掉 了 这 种 

















设计 。 


使 用 Memleak 可 以 审查 系统 中 的 任何 实例 ， 接 下 来 会 审查 com. sun. jmx.mbeanserver. 
RepositorySupport 类 ， 看 一 下 它 是 否 真 的 需要 使 用 Hashtable 实例 。 
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10.7 ”追踪 内 存 分 配 


接 下 来 要 介绍 本 书 中 有 关 Memleak 的 最 后 一 个 特性 ， 即 跟踪 指定 类 型 的 内 存 分 配 。 以 之 前 
的 示例 来 说 ， 就 是 找 出 LeaksDemoobject 实例 都 是 在 哪里 分 配 的 。 右 键 点 击 目标 类 型 ， 选 择 
Trace Allocations 菜单 ， 然 后 Memleak 会 将 导致 内 存 泄漏 的 目标 代码 附近 的 方法 调用 列 出 来 。 



































FT) [M4.0.0-jrockitqa__-129115-1.5] Leak 21 (1 600) 33 
E Allocation Ü 
Allocation Stack Traces Es > 0 e® 
Tracing allocations of Leak$DemoObject{0}. 
Trace Percent Count 
4 ® Leak$DemoThread.put(int) 50,22% 104 794 
% Leak$DemoThread.runQ) void Leak$DemoThread.put(int) [Leak java:79] 100,00% 104 794 
4 % Leak$DemoThread.remove(int) 49,78% 103 877 
% Leak$DemoThread.run() 100,00% 103 877 
[=] Trend | =] Type Graph |E] Type Tree e Instance Graph |[&| Instance Tree |E, Allocation | 

















从 上 面 的 截图 中 可 以 看 到 ，put 方法 调用 次 数 多 于 remove 方法 。 如 果 是 在 Eclipse 中 运行 
Memleak 的 话 , 右键 点 击 相应 的 栈 帧 ,选择 Open Method 菜单 就 可 以 直接 跳 转 到 目标 代码 处 了 。 
针对 某 个 类 的 内 存 分 配 追 踪 只 能 启用 一 次 。 

















注意 : 针对 某 些 类 启用 内 存 分 配 追 踪 可 能 会 引入 较 大 的 性 能 开销 。 例 如 ， 因 
为 java.lang.String 类 的 使 用 非常 频繁 ， 追 踪 它 的 内 存 分 配 显然 不 太 理智 。 


10.8 ”问题 排查 




















如 果 Memleak 连接 不 上 JVM 的 话 , 可 能 是 因为 Memleak 需要 使 用 一 个 额外 的 端口 。 与 其 他 
JRockit Mission Control 中 的 工具 不 同 ，Memleak 并 非 仅仅 依赖 于 JMX 来 完成 工作 ， 还 需要 一 个 
运行 在 JVM 内 部 的 MLS ( MemLeak server )。 

启动 Memleak 时 ,会 通过 JMX 来 发 送 请 求 ， 然 后 MLS 会 启动 并 返回 一 个 用 于 通信 的 端口 。 
在 启动 之 后 ， 客 户 端 就 不 再 使 用 JMX 了 ， 而 是 使 用 私有 协议 MLP (memory leak protocol ) 和 返 
回 的 端口 来 通信 。 

MLS 是 内 建 于 JRockit 中 的 本 地 服务 器 ， 原 本 是 希望 可 以 在 Java 堆 之 外 运行 MLS， 以 便 在 
JVM 在 发 生 OutOfMemoryError 错误 时 启动 MLS， 有 点 像 发 后 outofMemoryError 错误 时 就 
执行 堆 转 储 。 原 本 是 想 在 IVM 加 入 一 个 特殊 的 标记 位 来 实现 挂 起 JVM 并 启动 MLS 的 ， 但 可 民 
的 是 ， 这 一 点 一 直 都 没有 实现 。 

在 JRockit Mission Control 中 可 以 设置 MLS 所 使 用 的 具体 端口 。 

此 外 ， 还 需要 注意 的 是 : 
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O 任意 时 间 ， 只 能 有 一 个 客户 端 连 接 到 MLS; 
口 当 客 户 端 断 开 时 ，MLS 会 自动 关闭 。 





10.9 “小结 


本 章 详细 介绍 了 JRockit Mission Control Memory Leak Detector 的 用 法 ， 包 括 如 何 追 查 内 存 泄 
漏 的 源头 ， 以 及 在 各 种 场景 下 ，Memory Leak Detector 的 优 缺点 。 

此 外 ， 还 通过 示例 介绍 了 如 何 使 用 Memory Leak Detector 来 排查 慢性 内 存 泄漏 ， 以 及 如 何 交 
互 式 地 使 用 Memleak 进行 内 存 泄漏 方面 的 测试 。 

之 后 介绍 了 如 何 将 MemLeak 作为 交互 式 通用 堆 分 析 器 来 查看 堆 中 两 种 类 型 之 间 的 引用 关 
系 ， 以 及 审查 堆 中 实例 的 具体 内 容 。 

最 后 ， 简 单 介 绍 了 如 何 解决 与 Memleak 相关 的 常见 问题 。 

































































JRCMD 








本 章 将 详细 介绍 JRockit 发 行 版 中 最 简单 的 工具 IRCMD. JRCMD 是 个 命令 行 工具 ， 可 以 列 
出 系统 上 正在 运行 的 所 有 JRockit JVM， 并 与 其 中 的 某 个 实例 交互 ， 执 行 相关 操作 。 
本 章 主要 内 容 如 下 。 
口 如 何 使 用 JRCMD 列 出 系统 上 所 有 正在 运行 的 JVM 实例 ; 
口 如 何 使 用 IRCMD 在 运行 中 的 JVM 上 执行 诊断 指令 ; 
口 如 何 覆 盖 TRockit JVM 中 对 sIGQUIT 信号 的 默认 处 理 操作 ; 
口 如 何 使 用 IRCMD 完成 如 下 任务 : 
m 推 分 析 
m 异常 分 析 
m 追踪 本 地 内 存 
m 控制 Management Server 的 生命 周期 
m 通过 命令 行 控制 JFR 
11.4 节 是 IRCMD 的 参考 文档 ， 按 字母 表 顺 序列 出 了 JRCMD 中 的 诊断 指令 ， 并 辅 以 相应 的 
示例 。 








11.1 简介 


有 时 候 ， 使 用 命令 行 工具 才 是 最 适当 的 ， 例 如 对 SVM 执行 一 些 批 处 理 命令 ， 又 或 者 受 操 作 
环境 限制 ， 只 能 通过 SSH 执行 有 限 的 命令 。 总 体 来 说 ，JRCMD 这 款 小 巧 而 强大 的 工具 非常 适合 
给 运行 在 本 地 的 JRockit JVM 发 送 相关 指令 。 
直接 运行 JRCMD, 不 附带 任何 参数 的 话 ， 会 列 出 当前 系统 中 正在 运行 的 JVM， 显 示 结 果 包 o 
括 系统 进程 ID (process ID, PID) 和 局 动 Java 应 用 程序 的 主 类 ， 如 下 所 示 。 
C:\>JROCKIT_HOME\bin\ jromd 


2416 com.jrockit.mc.rcp.start.MCMain 
19344 jrockit.tools.jrcemd.Jrcmd 





























在 上 面 的 示例 中 ， 列 出 了 两 个 当前 正在 运行 的 JVM 实例 ， 分 别 是 TRockit Mission Control Fil 
JRCMD 自身 。 
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若 想 给 JVM ASKS, WUT DRG S TEN TEBE IRCMD. FE 0 作为 PID 
传 给 RCMD 的 话 , 则 IRCMD 会 在 它 所 能 找到 的 所 有 正在 运行 的 JVM 上 执行 目标 命令 。 由 于 系 
统 中 可 能 同时 运行 了 多 个 版 本 的 JRockit JVM， 而 且 其 所 支持 的 命令 集合 也 未 必 相 同 ， 以 0 作为 
PID 时 ， 某 些 命令 可 能 无 法 起 效 。 因 此 , 一般 情 况 下 会 对 指定 的 PID 发 送 命令 。 另 外 需要 注意 的 
， 依 据 不 同 的 命令 行 参数 和 配置 选项 ， 即 便 是 相同 版 本 的 耻 ockit JVM， 也 可 能 会 支持 不 同 的 
命令 集合 。 

若 想 查 看 目标 JRockit 实例 所 支持 的 命令 列表 ， 可 以 使 用 及 CMD 的 help 命令 ， 如 下 所 示 : 

C:\>JROCKIT_HOME\bin\jrcmd 2416 help 

2416: 

The following commands are available: 

kill_management_server 
start_management_server 


print_object_summary 
memleakserver 























=> tia 





For more information about a specific command use 'help <command>'. 
Parameters to commands are optional unless otherwise stated. 


在 后 续 的 示例 中 ,会 假设 已 经 将 SJROCKIT HOME/bin 目录 添加 到 操作 系统 的 PATH 变量 中 。 

JRCMD 支持 的 命令 一 般 被 称 为 JRockit Diagnostic Commands, ， 可 以 通过 JRockit 
Management API ( JMAPI ) 或 自 定义 JRockit JMX MBeans ( JMXMAPI ) 来 访问 。 

诊断 命令 有 多 种 使 用 方法 ，JMAPI 和 JMXMAPI 可 以 在 Java 中 以 编程 的 方式 调用 ， 
中 会 对 此 做 详细 介绍 。 
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11.2 7 sicourt 信号 处 理 句 柄 


通过 IRCMD 的 诊断 命令 可 以 覆盖 JVM 对 SITGQUIT 信和 号 的 处 理 过 程 。 在 第 4 章 中 曾经 介绍 
过 ， 默 认 情 况 下 ，JVM 在 接收 到 STGQUIT 信号 时 会 执行 线程 转 储 ， 将 包含 线程 状态 的 调用 栈 信 
息 打 印 到 控制 台 。 在 Windows 系统 中 , 可 以 通过 Ctrl + Break 组 合 键 发 送 SIGoUIT 信和 号 ; 在 Linux 
系统 中 , 则 是 Ctrl+\ 组 合 键 来 实现 ; 在 类 Unix 系统 中 , 通过 命令 kill -3 <PID> 或 kill -QUIT 
<PID> 来 向 指定 进程 发 送 SIGQUIT 信号 。 

想 要 覆盖 JRockit JVM 对 SICQUIT 信号 的 默认 人 处理 方式 , 可 以 新 建 一 个 名 为 ctrlhandler.act 的 文 
件 ， 把 所 要 执行 的 及 CMD 命令 序列 写 入 到 该 文件 中 ， 将 该 文件 存放 到 $JROCKIT_HOME/ib H 
SKER JVM 进程 的 当前 目录 下 即 可 。 如 下 所 示 : 

version 


print_threads 
print_object_summary 


也 可 以 使 用 命令 行 参数 -f 来 为 IRCMD 指定 ctrlhandler.act 文件 的 位 置 ， 在 其 中 指定 所 要 执 
行 的 命令 。 
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SS 诊断 命令 最 初 的 含义 就 是 退出 信号 处 理 程序 (control break handler )。 





下 面 的 示例 展示 了 如 何 通过 -f 参数 为 IRCMD 指定 所 要 执行 的 命令 : 


C:\>jremd 7736 -f c:\tmp\ctrlhandler.act 

7736: 

Oracle JRockit(R) build R28.0.0-670-129329-1.6.0_17 
-20100219-2122-windows-ia32, 

compiled mode 

GC mode: Garbage collection optimized for short pausetimes, 
strategy: genconcon 


===== FULL THREAD DUMP =============== 
Mon Mar 01 15:53:40 2010 
Oracle JRockit(R) R28.0.0-670-129329-1.6.0_17-20100219-2122-windows-ia32 


"Main Thread" id=1 idx=0x4 tid=7420 prio=6 alive, in native 
at org/eclipse/swt/internal/win32/0S.WaitMessage()Z(Native Method) 
at org/eclipse/swt/widgets/Display.sleep(Display.java:4220) 
at org/eclipse/ui/application/WorkbenchAdvisor.eventLoopIdle 
(Workbenchadviso 
r.java:364) 
at org/eclipse/ui/internal/Workbench.runEventLoop (Workbench. java: 2385) 
at org/eclipse/ui/internal/Workbench.runUI (Workbench. java: 2348) 


-- end of trace 


soso Detailed Heap Statistics: --------- 


39.1% 8232k 140800 +8232k [C 
13.5% 2840k 121192 +2840k java/lang/String 
10.1% 2135k 2933 +2135k [Ljava/util/HashMapSEntry; 


5.5% 1161k 49568 +1161k java/util/HashMapsEntry 
4.2% 889k 8136 +889k java/lang/Class 

4.1% 869k 18430 +869k [I 

4.0% 841k 15322 +841k [Ljava/lang/Object; 
2.0% 414k 299 +414k [B 

1.3% 281k 12015 +281k java/util/ArrayList 

1 





.2% 256k 4698 +256k org/eclipse/core/internal 
/registry/ReferenceMap$Soft 
Ref 
1.1% 241k 1843 +241k [[C 
0.6% 136k 2907 +136k java/util/HashMap 
0.6% 130k 275 +130k [Ljava/util/HashtablesEntry; 
0.6% 116k 2407 +116k [Ljava/lang/String; 


21054kB total --- 


--------- End of Detailed Heap Statistics --- 
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特殊 命令 


默认 情况 下 ， 有 些 诊断 命令 是 无 法 使 用 的 ， 例 如 无 法 强制 TRockit JVM 表演 做 核心 转 储 ， 或 
是 创建 并 启动 一 个 新 的 线程 。 为 安全 起 见 ， 这 些 命令 默认 是 被 禁用 的 ， 必 须 在 启动 JRockit JVM 
时 通过 命令 行 参数 来 显 式 启 用 。 

使 用 jrockit.ctrlbreak.enable<command>=[true| false] 格式 的 参数 可 以 显 式 地 局 
用 指定 的 命令 ， 例 如 : 


-Djrockit.ctrlbreak.enableforce crash=true 
-Djrockit.ctrlbreak.enablerun class=true 


















































11.3. JRCMD 的 限制 


JDK 中 的 tools.jar 包 中 包含 了 可 以 动态 连接 到 正在 运行 的 JVM 的 Attach APl。JRockit Mission 
Control 使 用 Attach API 来 检测 本 地 系统 中 正在 运行 的 JVM， 以 及 调用 相关 的 诊断 命令 。 

启动 JVM 时 , 会 在 系统 变量 所 指定 的 临时 目录 中 创建 进程 说 明文 件 。 JRCMD 使 用 这 些 文件 
All Attach API 来 查找 当前 用 户 所 运行 的 JVM 实例 。 为 了 安全 起 见 , Attach API 依赖 于 文件 系统 对 
进程 说 明文 件 的 访问 权限 的 控制 ， 也 就 是 说 ， 如 果 临 时 目录 位 于 一 个 不 安全 的 文件 系统 ( 例如 
FAT )， 则 JRCMD 就 无 法 正常 工作 。 男 外 ， 安 全 限制 还 要 求 ，JRCMD 的 用 户 和 JVM 进程 的 启动 
者 必须 是 同一 人 ， 于 是 造成 的 一 个 问题 是 , 在 Windows 系统 上 , AY Java 程序 设 定 为 系统 服务 ， 
则 无 法 通过 IRCMD 访问 到 该 进程 。 

如 果 以 root 用 户 启动 JRockit HERE, 而 后 又 将 自身 降 为 低 权限 用 户 , 则 由 于 安全 策略 的 限制 ， 
JRCMD 无 法 连接 到 之 前 启动 的 Java 进程 。 使 用 root 账户 可 以 列 出 JVM 进程 ,但 以 root 账户 发 
送 的 任何 诊断 命令 都 会 被 解释 为 SIGoUIT 信号 ,并 打印 线程 转 储 信息 。 低 权限 用 户 无 法 列 出 JVM 
进程 ， 但 如 果 知 晓 目 标 JVM 进程 号 ， 则 依然 可 以 向 其 发 送 诊断 命令 。 

本 章 会 详细 介绍 常用 的 诊断 命令 。 



































11.4 JRCMD 命令 参考 





为 便于 使 用 ， 本 节 中 的 命令 按 字 母 顺序 编排 ， 若 该 命令 只 在 JRockit R27 或 R28 的 某 个 版 本 
得 到 支持 ， 则 会 在 标题 旁 注 明 版 本 信息 ， 否 则 表示 这 两 个 版 本 均 支 持 该 命令 。 


11.4.1 check flightrecording (R28) 

















在 JRockit R27 中 ， 与 该 命令 相对 应 的 是 cneckjrarecording。 该 命令 用 于 检查 JFR 引擎 
的 状态 ,更 多 有 关 JFR 的 内 容 ， 请 参见 第 8 章 和 第 9 章 。 一 般 情 况 下 ， 该 命令 至 少 会 返回 一 条 当 
前 正在 进行 的 记录 任务 ， 因 为 大 部 分 版 本 的 R28 在 运行 的 时 候 都 会 开启 一 个 低 消耗 的 记录 任务 。 
由 于 JRockit JVM 中 可 能 同时 存在 多 个 正在 执行 的 记录 任务 , 可 以 为 该 命令 指定 一 个 任务 ID , 以 
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便 获 取 目 标 任务 的 执行 状态 。 如 果 不 指定 参数 ,或 者 参数 值 为 -1, 则 会 返回 所 有 正在 执行 的 任务 
的 状态 。 除 了 指定 任务 ID 外 ， 还 可 以 通过 参数 name 来 指定 记录 任务 的 名 字 。 如 果 是 持续 型 记 
录 任 务 ， 可 以 将 参数 name 设置 为 continuous 来 查找 。 

例如 : 


C:\>jremd 6328 check flightrecording name=continuous verbose=true 
6328: 

Recording : id=0 name="continuous" duration=0s (running) 
http://www.oracle.com/jrockit/jvm/: 
java/alloc/accumulated/thread : disabled period=1000 
java/alloc/accumulated/total : enabled period=0 
java/alloc/object/in_new_tla : disabled threshold=10000000 
java/alloc/object/outside_tla : disabled threshold=10000000 
java/exception/stats : enabled period=1000 
java/exception/throw : disabled period=1000 

java/file/read : disabled threshold=10000000 
java/file/write : disabled threshold=10000000 
java/monitor/enter : disabled threshold=10000000 
java/monitor/profile : disabled period=1000 
java/monitor/wait : disabled threshold=10000000 
java/socket/read : disabled threshold=10000000 
java/socket/write : disabled threshold=10000000 
java/thread/end : enabled period=0 

java/thread/park : disabled threshold=10000000 
java/thread/sleep : disabled threshold=10000000 
java/thread/start : enabled period=0 

vm/class/load : disabled threshold=10000000 
vm/class/memory/free : enabled threshold=0 


如 果 将 参数 verbose 的 值 设 为 false, 则 只 会 简单 列 出 记录 任务 的 id name 和 duration; 
而 设 为 true 后 ， 则 会 像 示例 一 样 ， 列 出 记录 任务 的 事件 生成 器 ， 以 及 每 个 事件 生成 器 的 事件 类 
型 。 上 面 的 示例 中 列 出 了 活动 的 持续 型 记录 ， 其 ID 为 0。 

参见 命令 start_flightrecording, stop_flightrecording 和 dump_flightrecor- 


ding 的 说 明 。 


















































11.4.2 checkjrarecording (R27) 








该 命令 通常 与 startjrarecording 命令 一 起 使 用 , 用 于 检查 JRockit JVM 中 是 否 已 经 存在 
正在 执行 中 的 记录 任务 。 若 是 IRA 中 已 经 有 记录 任务 正在 执行 ， 则 会 列 出 该 任务 的 设置 参数 。 
下 面 的 示例 是 启动 RA 记录 任务 执行 cneckjrarecording 命令 9 秒 钟 之 后 的 结果 : 


C:\>jrcmd 5516 checkjrarecording 

5516: 

JRA is running a recording with the following options: 

filename=D:\myrecording.jra, recordingtime=120s, methodsampling=1, 

gcsampling=1, heapstats=1, nativesamples=0, methodtraces=1, 
sampletime=5,zip=1, hwsampling=0, delay=0s, tracedepth=64 
threaddump=1, threaddumpinterval=0s, latency=1, 
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latencythreshold=20ms, cpusamples=1, cpusampleinterval=i1s 
The recording was started 9 seconds ago. 
There are 111 seconds left of the recording. 


上 面 示例 中 的 记录 任务 是 通过 start jrarecording 命令 启动 的 。 
参见 命令 startjrarecording 和 stopjrarecording 的 说 明 。 








11.4.3 command_line 


有 时 候 ， 需 要 检查 JRockit JVM 的 启动 设置 。 比 如 ， 当 JVM 的 垃圾 回收 需 行 为 比较 奇怪 时 ， 
可 以 使 用 该 命令 来 检查 相关 的 参数 配置 ， 又 或 者 使 用 该 命令 查看 随 JVM 一 起 启动 的 管理 代理 的 
配置 ， 例 如 SSL 配置 是 否 正确 。 

该 命令 会 列 出 JVM 的 启动 参数 ， 只 不 过 在 这 里 列 出 的 是 实际 传递 给 JVM 的 参数 ,可 能 包括 
那些 用 户 隐 式 传 给 JVM 的 参数 。 如 下 所 示 : 


C:\>jrcmd 2416 command line 

2416: 

Command Line: -Denv.class.path=.;C:\Program Files\ 
Java\jre6\lib\ext\QTJava.zip -Dapplication.home=C:\jrockits\R28.0.0_ 
R28.0.0-547_1.6.0 -client -Djrockit.ctrlbreak.enableforce_crash=true 
-Dsun.java.launcher=SUN_STANDARD com. jrockit.mc.rcp.start .MCMain 
-Xmx512m -Xms64m -Xmanagement :port=4712,ssl=false,authenticate=false 


























11.4.4 dump_flightrecording (R28) 


该 命令 用 于 在 不 中 断 记录 任务 的 情况 下 , 获取 记录 内 容 , 因此 可 以 获取 持续 性 记录 任务 的 内 
容 。 其 基本 实现 是 ， 克 隆 目 标 任务 ， 和 暂停 该 克隆 后 的 记录 任务 ， 再 将 之 写 和 到 硬盘 中 。 对 于 大 多 
数 R28 版 本 的 JRockit 来 说 ， 默 认 情 况 下 执行 该 命令 时 都 不 会 停止 持续 性 记录 任务 。 

例如 : 


C:\>jrcmd 7420 dump_flightrecording recording=0 
copy_to_file=my_continuous_snapshot.jfr.gz compress_copy=true 


在 上 面 的 示例 中 , 通过 命令 指示 IRCMD 对 编号 为 0 的 记录 任务 转 储 ， 并 将 内 容 写 人 本 地 文 
{F my_continous_snapshot.jfr.gz。 一 般 情况 下 ,编号 为 0 的 是 持续 性 记录 任务 , 会 一 直 在 JVM 中 
运行 。 当 然 ， 也 可 以 通过 参数 name 来 指定 要 转 储 的 记录 任务 ,例如 name=continuous。 设 置 
参数 compress_copy W true 时 ,会 将 转 储 文件 以 gzip 进行 压缩 。 

参见 命令 startjrarecording、stopjrarecording 和 check_flightrecording 命令 


的 说 明 。 


















































11.4.5 heap diagnostics (R28) 


heap_diagnostics 命令 用 于 获取 JVM 中 堆 的 详细 信息 ,包括 内 存 使 用 情况 和 引用 对 象 使 
用 情况 等 信息 。 执 行 该 命令 时 ， 会 触发 一 次 Full GC 来 收集 相关 信息 。 该 命令 不 接受 其 他 参数 。 
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输出 信息 包含 3 个 部 分 。 

第 1 部 分 是 系统 信息 ， 包 括 可 用 内 存 总 量 和 推 内存 总 量 。 如 下 所 示 : 
C:\>jremd 7420 heap_diagnostics 

7420: 


Invoked from diagnosticcommand 
======== BEGIN OF HEAPDIAGNOSTIC ========================= 





Total memory in system: 3706712064 bytes 

Available physical memory in system: 1484275712 bytes 
-Xmx (maximal heap size) is 1073741824 bytes 
Heapsize: 65929216 bytes 

Free heap-memory: 8571400 bytes 


Pets 


第 2 部 分 是 Detaileq Heap Statistics, ÆA L5 print _object_summary 命令 的 输 
出 相同 , 但 不 包含 可 选 points-to 信息 。 这 里 会 列 出 系统 中 所 有 类 型 的 相关 信息 ， 因 此 输出 内 容 会 
很 长 。 

O 第 1 列 是 当前 类 型 的 实例 所 占用 的 堆 内 存 的 百分比 。 

O 第 2 列 是 当前 类 型 的 实例 所 占用 的 堆 内 存 的 大 小 ， 单 位 为 KB。 

口 第 3 列 是 当前 类 型 的 存活 对 象 的 数量 。 

口 第 4 列 是 自 上 一 次 调用 neap_diagnostics 命令 后 ,当前 类 型 的 实例 占用 堆 内 存 大 小 的 
变化 值 ， 单 位 为 KB。 

口 第 5 列 是 类 型 名 。 在 下 面 的 示例 中 ， 大 部 分 堆 内 存 都 被 字符 数组 所 占用 。 


= Detailed Heap Statistics: --------- 























25.9% 3179k 37989 +0k [C 

9.6% 1178k 2210 +0k [I 

7.4% 912k 38943 +0k java/lang/String 
7.4% 906k 265 +0k [B 

6.2% 764k 6994 +0k java/lang/Class 


12257kB total --- 


--------- End of Detailed Heap Statistics --- 


第 3 部 分 是 引用 对 象 统计 信息 (reference object statistic )， 即 引用 对 象 使 用 情况 的 详细 信息 ， 
例如 弱 引 用 。 引 用 对 象 信 息 也 是 按照 类 型 划分 的 ,在 每 种 类 型 下 ， 都 会 按照 对 象 所 指向 的 类 型 分 
组 列 出 ， 若 是 指向 的 是 终结 器 ， 则 按 其 声明 类 型 分 组 。 如 下 所 示 。 

口 第 1 列 是 实例 的 数量 。 
口 第 2 列 是 处 于 可 达 状 态 的 实例 的 数量 。 

口 第 3 列 是 处 于 不 可 达 状 态 的 实例 的 数量 。 

口 第 4 列 是 在 之 前 存活 ， 但 在 本 轮 GC 中 处 于 不 可 达 状 态 的 引用 对 象 的 数量 。 

O 第 5 列 是 在 本 轮 GC 之 前 , 处 于 可 达 状 态 的 引用 对 象 的 数量 。 如 果 引 用 对 象 被 放 和 人 到 引用 
队列 中 ， 则 它们 可 能 会 在 引用 队列 中 竺 一段 时 间 ， 直 到 被 移出 引用 队列 。 

口 第 6 列 是 指向 null 实例 的 实例 数量 。 
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口 第 7 列 是 引用 对 象 所 指向 的 类 型 。 


----- Reference Objects statistics separated per class ----- 
Total Reach Act PrevAct Null 








Soft References: 


637 81 0 4 552 Total for all Soft References 
java/lang/ref/SoftReference => 
559 7 0 0 552 Total 
552 0 0 0 552 => null 
2 2 0 0 0 => [Ljava/lang/reflect/Constructor; 
1 1 0 0 0 => 


org/eclipse/osgi/internal/baseadaptor/DefaultClassLoader 


1 1 0 0 0 => [Ljava/lang/String; 

1 1 0 0 0 => java/util/jar/Manifest 

1 1 0 0 0 => java/lang/StringCoding$StringDecoder 
1 T 0 0 0 => sun/font/FileFontStrike 


java/util/ResourceBundle$BundleReference => 


44 42 0 2 0 Total 

31 31 0 0 0 => java/util/ResourceBundle$1 

11 11 0 0 0 => java/util/PropertyResourceBundle 
2 0 0 2 0 => null 


org/eclipse/core/internal/registry/ReferenceMap$SoftRef => 


21 20 0 1 0 Total 
20 20 0 0 0 => 
org/eclipse/osgi/framework/internal/core/BundleHost 
1 0 0 1 0 => null 


sun/misc/SoftCache$ValueCell 
1 0 0 1 0 Total 
1 0 0 1 0 => null 


1 
v 


Weak References: 
3084 2607 0 236 241 Total for all Weak References 


java/lang/ref/WeakReference => 
1704 1463 0 0 241 Total 
765 765 0 0 0 => java/lang/String 
330 330 0 0 0 => java/lang/Class 
241 0 0 0 241 => null 


Phantom References: 
6 6 0 0 0 Total for all Phantom References 


java/lang/ref/PhantomReference => 


6 6 0 0 0 Total 
5 5 0 0 0 => java/lang/Object 
1 1 0 0 0 => sun/dc/pr/Rasterizer 


Cleared Phantom: 
9 9 0 0 0 Total for all Cleared Phantom 
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jrockit/vm/ObjectMonitor => 


9 9 0 0 0 Total 
2 2 0 0 0 => 
org/eclipse/osgi/framework/eventmgr/EventManagerSEventThread 
1 1 0 0 0 => java/util/TaskQueue 
Finalizers: 
197 197 0 0 0 Total for all Finalizers 
88 88 0 0 0 => java/util/zip/ZipFile 
55 55 0 0 0 => java/util/zip/Inflater 
18 18 0 0 0 => java/awt/Font 
14 14 0 0 0 => java/lang/ClassLoadersNativeLibrary 
Weak Handles: 
12309 12309 0 0 0 Total for all Weak Handles 
9476 9476 0 0 0 => 
org/eclipse/osgi/internal/baseadaptor/DefaultClassLoader 
1850 1850 0 0 0 => java/lang/String 


Soft reachable referents not used for at least 198.332 s cleared. 
4 SoftReferences were soft alive but not reachable 
(when found by the GC), 
0 were both soft alive and reachable, and 633 were not soft alive. 
----- End of Reference Objects statistics ----- 
======== END OF HEAPDIAGNOSTIC ========================== 


从 这 个 示例 中 可 以 看 到 ， 大 部 分 弱 引 用 对 象 都 指向 String 类 的 实例 。 弱 引用 对 象 是 指 由 
java.lang.ref.WeakReference 实例 引用 的 对 象 。 在 示例 中 系统 中 , 共有 3084 个 弱 引 用 , 其 
中 2067 个 处 于 可 达 状 态 。 另 外 , 在 示例 中 可 以 看 到 ， 软 引用 对 象 指 向 的 对 象 至 少 存活 了 198 秒 。 

对 于 粗 粒度 的 对 象 引 用 分 析 和 堆 使 用 率 分 析 来 说 , heap_diagnostics 命令 是 非常 有 用 的 。 
当然 ,使 用 JFR 或 Memleak Tool 可 以 更 简便 地 实现 同样 功能 。 

参见 print_object_summary 命令 的 说 明 。 












































11.4.6 hprofdump (R28) 


有 时 候 ， 需 要 将 堆 内 存 转 储 到 本 地 文件 以 便 做 离线 分 析 。 到 Rockit R28 版 本 时 ，JRockit 可 
以 生成 HPROF 格式 的 堆 转 储 文件 ， 这样 就 可 以 使 用 其 他 支持 HPROF 格式 的 工具 (例如 Eclipse 
memory analyzer tool, MAT ) 做 离线 分 析 了 。 
使 用 方式 如 下 所 示 : 
C:\>jrcmd 7772 hprofdump filename=mydump.hprof 
segment_threshold=2G segment_size=1G 
7772: 
Wrote dump to mydump.hprof 
使 用 参数 segment_threshold 和 segment_size 可 以 将 转 储 文件 分 割 为 几 个 较 小 的 文件 。 
在 上 面 的 示例 中 ， 当 JVM 堆 超 过 2 GB 时 , 会 以 1 GB 为 大 小 分 割 为 多 个 转 储 文件 。 
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能 使 用 参数 segment_threshold fe segment_size. 


| NSS 注意 ， 只 有 在 工具 支持 Java PROFILE 1.0.2 HPROF 格式 的 转 储 文件 时 ， 才 





生成 的 转 储 文件 会 放 到 ROCKIT HOME 目录 下 , 如 果 不 指定 文件 名 的 话 , 会 以 时 间 截 来 命 
名 文件 ， 如 下 所 示 : 
C:\>jremd 7772 hprofdump 


7772: 
Wrote dump to heapdump_Tue_Sep_22_19 09 16 2009 























人 参见 命令 memleakserver 和 oom diagnostics。 


11.4.7 kill_management_server 


该 命令 用 于 关闭 外 部 管理 服务 器 (external management server )。 曾 经 ， 因 为 存在 一 些 问题 ， 
导致 以 stop 开头 的 命令 会 终止 对 ctrlhandleract 文件 的 解析 ， 于 是 就 没有 将 关闭 管理 服务 器 的 命 


命名 为 stop_management_servero 


使 用 该 命令 时 无 须 添 加 额外 的 参数 ， 如 下 所 示 : 


C:\>jremd 7772 kill_management_server 
7772: 








参见 start_management_serv x 命令 。 


11.4.8 list vmflags (R28) 





某 些 JVM 参数 可 以 通过 类 似 -xx:<Flag>=<value> 的 形式 来 设置 ,在 第 1 
这 里 的 参数 称 为 VM 参数 ( VM flag )， 可 以 通过 命令 1ist_vmflags 列 出 这 些 参数 。 
如 下 所 示 


C:\>jremd 7772 list_vmflags describe=true alias=true 


Global: 
UnlockDiagnosticVMOptions = false (default, writeable) 
- Enable processing of flags relating to field diagnostics 
UnlockInternalvMOptions = false (default) 
- Enable processing of internal, unsupported flags 
Class: 
FailOverToOldverifier = true (default, writeable) 
- Fail over to old verifier when split verifier fails 
UseVerifierClassCache = true (default) 
- Try to cache java.lang.Class lookups for old verifier. 
UseClassGC = true (default) 
(Alias: -Xnoclassgc) 
- Allow GC of Java classes 


Threads: 
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UseThreadPriorities = false (default) 
- Use native thread priorities 
DeferThrSuspendLoopCount = 4000 (default, writeable) 
- Number of iterations in safepoint loop until we try blocking 





由 于 VM 参数 非常 多 , 上 面 的 示例 中 只 列 出 了 其 中 的 一 部 分 。 其 中 某 些 VM 参数 可 以 在 运行 
过 程 中 通过 set_vmflag 命令 动态 设置 ， 而 另外 一 些 则 只 能 在 启动 时 设置 。 








对 于 经 验 丰 富 的 用 户 来 说 ， 可 以 在 启动 JVM 时 ,设置 参数 -xX:Unlock- 
InternalVMOptions=true 以 开启 对 JVM 内 部 参数 的 访问 。 不 过 ， 风 险 自 负 。 


参见 set_vmflag 命令 。 


11.4.9 lockprofile print 


只 有 当 JVM 开启 了 锁 分 析 (使 用 JVM 参数 -xX:UseLockProfiling=true | 





NativeLockProfiling=true， 人 参见 第 4 章 的 相关 内 容 ) 时 ， 该 命令 才 会 生效 ， 会 打印 出 锁 
分 析 的 相关 内 容 。 

C:\>jrcmd 1442 lockprofile_print 

1442: 


Class, Lazy Banned, Thin Uncontended, Thin Contended, Lazy Reservation, 
Lazy lock, Lazy Reverted, Lazy Coop-Reverted, Thin Recursive, Fat 
Uncontended, Fat Contended, Fat Recursive, Fat Contended Sleep, 
Reserve Bit Uncontended, Reserve Bit Contended 

[B, false, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/lang/Thread, false, 11, 0, 3, 0, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/security/Permissions, false, 0, 0, 2, 2, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/util/Hashtable, false, 0, 0, 34, 524, 1, 0, 0, 0, 0, 0, 0, 0, 0 

java/lang/Class, false, 0, 0, 24, 77, 2, 0, 0, 0, 0, 0, 0, 0, O 

java/lang/Object, false, 1, 0, 11, 139572, 1, 0, 0, 1, 0, 0, 0, 6, 0 

java/lang/StringBuffer, false, 0, 0, 137, 773, 0, 0, 0, 0, 0, 0, 0, 0, 0 

sun/nio/cs/StandardCharsets, 
false, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/util/Properties, false, 0, 0, 5, 479, 0, 0, 0, 0, 0, 0, 0, 0, 0 

java/lang/ThreadGroup, false, 0, 0, 3, 16, 1, 0, 0, 0, 0, 0, 0, 0, 0 

java/lang/ref/Reference$ReferenceHandler, 
false, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0 

sun/security/provider/Sun, 
false, 0, 0, 39, 5589, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/io/PrintStream, false, 0, 0, 7, 7818, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/net/URL, false, 0, 0, 70, 68, 0, 0, 0, 0, 0, 0, 0, 0, O 

java/io/ByteArrayInputStream, 
false, 0, 0, 47, 1115, 0, 0, 0, 0, 0, 0, 0, 0O, O 

java/util/logging/Logger, false, 0, 0, 2, 18, 0, 0, 0, 0, 0, 0, 0, 0, O 

jrockit/vm/CharBufferThreadLocal, 
false, 0, 0, 2, 0, 1, 0, 0, 0, 0, 0, 0, 0, O 

java/security/Provider$sService, 
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false, 0, 0, 1, 0, 0, 0, 0, 0, O, 0, 0, 0, O 
java/lang/Runtime, false, 0, 0, 1, 0, 0, 0, 0, 0, O, 0, 0, 0, O 
java/lang/reflect/Field, false, 0, 0, 8, 8, 0, 0, 0, 0, 0, 0, 0, 0, 0 
java/util/Random, false, 0, 0, 6, 18556549, 1, 0, 0, 0, O, 0, 0, 0, O 


参见 lockprofile_reset 命令 。 


11.4.10 lockprofile_ reset 
只 有 当 JVM 开启 了 锁 分 析 (使 用 JVM & & -xx:UseLockProfiling=true 和 
-XX:UseNativeLockProfiling=true， 人 参见 第 4 章 的 相关 内 容 ) 时 ， 该 命令 才 会 生效 ， 它 会 
重 置 当 前 锁 分 析 计 数 右 的 值 为 0。 
命令 


参见 lockprofile_print fif 








o 


11.4.11 memleakserver 





该 命令 用 于 启动 和 关闭 Memory Leak Server (MLS ), JRockit Meomory Leak Detector 使 用 
MLS 作为 本 地 服务 器 来 通信 。 正 常情 况 下 ，MLS 会 通过 JMX 自行 启动 , 但 某 些 情况 下 ， 不 得 不 
手动 开启 MLS。 例 如 ,可 能 只 想 启 动 MLS , 而 不 启动 JMX 代理 ,此 时 就 可 以 使 用 memleakserver 
命令 来 控制 MLS 的 生命 周期 ， 其 就 像 一 个 开关 一 样 ， 再 执行 一 次 就 可 以 关闭 MLS。 

下 面 的 命令 在 开启 MLS 时 ， 指 定 端口 为 7899: 


C:\>jremd 5516 memleakserver port=7899 
5516: 
Memleak started at port 7899. 


再 执行 一 次 ，MLS 就 会 关闭 : 


C:\>jremd 5516 memleakserver port=7899 
5516: 


关闭 MLS 时 不 会 输出 相关 内 容 。 


参见 hprofdump 命令 。 




































































11.4.12 oom diagnostics (R27) 














该 命令 是 JRockit R28 版 本 中 heap_diagnostics 命令 的 别名 。 
参见 heap_diagnosticso 


11.4.13 print_class_summary 


有 时 候 ， 需 要 查看 JVM 是 否 载 人 了 某 个 类 。 例 如 ， 某 个 SPI 框架 使 用 了 动态 类 载 人 功能 ， 
当 它 执行 失败 时 ,需要 查找 出 某 些 类 是 否 已 经 被 载 人 过 了 。 其 中 一 种 方案 是 转 储 出 所 有 已 载 和 的 
类 ， 然 后 使 用 grep 命令 来 查找 指定 的 类 。 使 用 print_class_summary 命令 就 可 以 很 方便 地 
转 储 出 所 有 的 类 。 如 下 所 示 : 
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C:\>jremd 5516 print_class_summary 

5516: 

- Class Summary Information starts here 
class java/lang/Object 

*class java/util/Vector$1 

*class sun/util/calendar/CalendarUtils 
*class sun/util/calendar/ZoneInfoFile$1 
*class sun/util/calendar/ZoneInfoFile 
*class sun/util/calendar/TzIDO1dMapping 
*class java/util/TimeZone$1 
*class java/util/TimeZone 
**class java/util/SimpleTimeZone 
**class sun/util/calendar/ZoneInfo 
*class sun/util/calendar/CalendarDate 
**class sun/util/calendar/BaseCalendar$Date 
***class sun/util/calendar/Gregorian§gDate 
*class sun/util/calendar/CalendarSystem 
**class sun/util/calendar/AbstractCalendar 
***class sun/util/calendar/BaseCalendar 
****kclass sun/util/calendar/Gregorian 








在 上 面 的 示例 中 , 输出 的 类 是 按照 各 自 的 继承 关系 来 排序 ,并 使 用 星 号 来 标识 继承 深度 。 下 
面 的 示例 则 展示 了 在 类 Unix 系统 上 如 何 查 找 具 体 的 类 型 : 


$ jrcmd 5516 print_class_summary | grep LoadAnd 
*class LoadAndDeadlock 

**class LoadAndDeadlock$LockerThread 

**class LoadAndDeadlocksAllocThread 














11.4.14 print codegen list 


该 命令 用 于 显示 当前 JVM 中 代码 生成 队列 和 优化 队列 的 长 度 。 使 用 参数 List 可 以 控制 是 
否 显 示 队 列 的 内 容 。 如 下 所 示 : 
C:\>jrcmd 1442 print_codegen_list list=true 


1442: 





format: <position> <directive no> <method description> 
strategies: q=quick, n=normal, o=optimize 

JIT queue: 0 methods in queue 

OPT queue: 
1 java/math/BigDecimal.<init>(Ljava/math/BigInteger;JII)V 
1 java/math/BigDecimal.add 
(Ljava/math/BigDecimal; )Ljava/math/BigDecimal; 
1 java/lang/String.<init>([C)V 
java/util/TreeMap$NavigableSubMap.size()I 
java/util/TreeMap$NavigableSubMap.setLastKey()V 
jrockit/vm/Strings.compare(Ljava/lang/String;Ljava/lang/String; )I 
com/sun/org/apache/xerces/internal/dom/CharacterDataImp1. 
setNodeValueInternal (Ljava/lang/String;Z)V 
1 com/sun/org/apache/xerces/internal/dom/ 


oO 
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CoreDocumentImp1.changed()V 

8: 1 java/lang/String.getChars(II[CI)Vv 

9: 1 com/sun/org/apache/xerces/internal/dom/NodeImp1.appendchild 
(Lorg/w3c/dom/Node; ) Lorg/w3c/dom/Node; 

10: 1 spec/jbb/Warehouse.getAddress()Lspec/jbb/Address; 

11: 1 jrockit/vm/ArrayCopy.copy_checks_done2 
(Ljava/lang/Object;ILjava/lang/Object;II)V 

12 methods in queue 


11.4.15 print _memusage (R27) 


正如 之 


Dep ate 


前 章节 


中 介绍 的 ， 除 了 Java 堆 之 外 ，JRockit 还 会 将 内 存 用 于 其 他 地 方 。 有 时 候 ， 若 


Java 堆 占用 了 太 多 内 存 ， 则 JRockit 则 可 能 会 没有 足够 的 本 地 内 存 使 用 。 命 令 print_memusage 
可 以 用 于 查看 JRockit 是 如 何 使 用 系统 内 存 的 。 如 下 所 示 : 











C:\>jremd 484536 print_memusage 
484536: 


[JRockit] memtrace is collecting data... 
[JRockit] *** Oth memory utilization report 


(all numbers are in kbytes) 

Total mapped 

; Total in-use 

; executable 

; java code 

hia used 

; Shared modules (exec+ro+rw) 

; guards 

; readonly 

;; rw-memory 

$ Java-heap 

j Stacks 

; Native-memory 

sae java-heap-overhead 

7277 codegen memory 

iii classes 

method bytecode 

method structs 

constantpool 

classblock 

class 

other classdata 

?7777 overhead 

haa threads 

ae malloc:ed memory 
codeinfo 
codeinfotrees 
exceptiontables 
metainfo/livemaptable 
codeblock structs 
constants 
livemap global tables 


28460 


;; 262144; 
PF 3472; 
7? 110775; 
ii 8206 
ii 896 
;7; 43008; 
i 4477 
ai 3895 
;; 18759 
$i 1596 
ii 3041 
pi 8280 
ii 34 
ii 24; 
i 22647; 
ee. 1231 
ry 429 
i 125 
ii 5883 


20.9% 
94.9% 


69.6% 
0.9% 
29.4% 


38.8% 


(#83104) 


(#8403) 


0.0% 
20.4% 
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27777 callprof cache i? 0 

MEER paraminfo 7 7 146 (#1979) 
77777 strings 23 8376 (#148622) 
27777 strings (jstring) 7? 0 

iia typegraph i? 2009 

722223 interface implementor list 7 40 

2727277 thread contexts ae} 19 

EEE jar/zip memory 7? 5378 

727777 native handle memory 7 7 19 

aia unaccounted for memory zap 36017} 32.5%;1.59 





从 上 面 的 示例 中 可 以 看 到 ，JRockit 进程 保留 了 1 GB 多 的 内 存 空间 自用 ， 看 起 来 有 点 多 , 但 
实际 上 ，JRockit 只 用 了 429 MB。 此 外 ，Java 堆 已 经 使 用 了 约 60% 的 空间 。 

该 命令 的 结果 以 树 形 显示 ， 每 个 分 配 节点 都 有 其 子 节点 ， 例 如 malloc:ed memory 表示 JVM 
内 部 的 结构 , 包括 存活 对 象 图 , 类 型 图 等 。 最 右 侧 的 百分比 数值 表示 当前 节点 占 父 节点 的 百分比 。 
顶层 节点 并 不 计算 百分比 , 之 前 提 到 Java 堆 大 约 已 经 使 用 了 60% 是 手工 计算 得 出 的 , 即 262， 
144/438,768 * 100 = 59.7%>5 

该 命令 还 可 用 来 追踪 本 地 内 存 发 生 的 内 存 泄漏 ， 例 如 使 用 JVMTI 开发 的 本 地 代理 中 出 现 的 

















11.4.16 print memusage (R28) 


与 该 命令 的 R27 版 本 类 似 , print_memusage 在 R28 版 本 中 仍旧 用 于 查看 JRockit 对 内 存 的 
使 用 ， 不 过 在 以 往 的 基础 上 做 了 些 改进 。 
在 排查 OOM out of memory ) 问题 时 , 该 命令 非常 有 用 。 正 如 第 10 章 中 介绍 的 ,很 多 时 候 ， 
内 存 泄漏 往往 是 无 意 中 持 有 无 用 对 象 造成 的 ， 但 有 的 时 候 ， 造 成 内 存 泄漏 的 原因 可 能 多 种 多 样 ， 
例如 本 地 资源 管理 不 善 等 。 具 体 来 说 ， 可 能 是 因为 打开 的 java.util.zip.GZIPOutput- 
Streams 实例 数量 超过 了 限制 ,类 载 人 器 持 有 了 太 多 的 类 ,或 第 三 方 JNI 代 码 中 造成 的 内 存 泄漏 
示例 如 下 : 


C:\>jrcmd 7772 print_memusage 
































o 





7772: 

Total mapped 1281284KB (reserved=1002164KB) 

- Java heap 1048576KB (reserved=932068KB) 

- GC tables 35084KB 

= Thread stacks 11520KB (#threads=27) 

- Compiled code 5696KB (used=5490KB) 

= Internal 840KB 

= os 67712KB 

= Other 48048KB 

= JRockit malloc 29184KB (malloced=27359KB #275574) 
- Native memory tracking 1024KB (malloced=537KB #11) 

- Java class data 33600KB (malloced=33471KB #41208) 























第 1 列 是 内 存 空 间 的 名 字 , 第 2 列 是 该 内 存 空间 所 占用 的 内 存 大 小 , 第 3 列 是 与 内 存 空 间 相关 
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的 详细 信息 。 在 上 面 的 示例 中 可 以 到 ，Java 堆 占用 了 内 存 的 绝 大 部 分 空间 ， 当 然 ， 这 是 正常 情况 。 
在 追踪 本 地 内 存 泄漏 问题 时 ， 通常 需要 查看 内 存 使 用 量 随时 间 的 变化 情况 。 使 用 参数 
baseline 可 以 建立 一 个 基点 开启 比较 分 析 。 
参数 scale 用 于 修改 显示 单位 ， 默 认为 KB。 
例如 ， 将 显示 单位 改 为 MB: 


C:\>jrcmd 7772 print_memusage scale=M baseline 


























7772: 

Total mapped 1252MB (reserved=978MB) 

- Java heap 1024MB (reserved=910MB) 

= Gc tables 34MB 

- Thread stacks 11MB (#threads=27) 

- Compiled code 5MB (used=5MB) 

- Internal OMB 

- Os 66MB 

a Other 47MB 

- JRockit malloc 28MB (malloced=26MB #275601) 
- Native memory tracking 1MB (malloced=0MB #11) 

= Java class data 32MB (malloced=32MB #41208) 





参数 baseline 用 于 执行 差异 化 分 析 ， 会 显示 出 在 基线 时 间 之 后 发 生 的 内 存 使 用 量变 化 。 


C:\>jremd 7772 print_memusage scale=M 





7772: 
Total mapped 1282MB +30MB (reserved=984MB +6MB) 
- Java heap 1024MB (reserved=910MB) 
- Gc tables 34MB 
= Thread stacks 14MB +3MB (#threads=35 +8) 
- Compiled code 6MB +1MB (used=6MB) 
= Internal OMB 
m Os 70MB +4MB 
F Other 49MB +2MB 
= JRockit malloc 41MB +13MB (malloced=34MB 
+8MB #330019 +54418) 
- Native memory tracking 2MB (malloced=1MB #21 +10) 
= Java class data 38MB +6MB (malloced=38MB 


+6MB #48325 +7117) 


从 上 面 的 示例 中 可 以 看 出 ， 在 设置 了 baseline 参数 后 ， 进 程 额外 使 用 了 30 MB 内 存 ， 其 
中 的 6MB 被 保留 了 下 来 。 此 外 , LHT 8 个 线程 , JRockit 也 多 分 配 了 8 MB 内 存 。 现在, JRockit 
本 地 堆 中 分 配 了 330 019 个 对 象 ， 比 之 前 增加 了 54 418 个 ， 因 而 多 使 用 了 13 MB 的 虚拟 内 存 。 


malloc object 是 在 JVM 内 部 使 用 类 似 于 malloc 系统 调用 分 配 到 的 内 存 。 例 
， 像 下 面 的 代码 这 样 就 会 在 本 地 堆 上 创建 一 个 malloc object 对 象 ， 并且 malloc 


VAN He 的 数量 加 一 。 


void * foo = malloe (512); 











类 似 地 ， 调 用 free(foo) 方法 会 将 malloc object 数量 减 一 。 
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若 要 重 置 baseline 参数 ,不 再 进行 比较 的 话 ， 可 以 使 用 reset BML: 
C:\>jrcmd 7772 print_memusage reset 
使 用 参数 trace_alloc_sites=1 可 以 开启 对 本 地 内 存 分 配点 的 追踪 ， 设 置 参数 trace_ 
alloc_sites=0 则 可 禁用 。 知 想 追 踪 所 有 的 本 地 内 存 分 配点 , 包括 JVM 启动 时 的 内 存 分 配 , 将 
环境 变量 TRACE_ALLOC_SITES 设置 为 1 即 可 。 

在 开启 分 配点 追踪 后 ， 会 根据 level 参数 的 值 来 显示 内 存 分 配 的 详细 信息 。 如 果 同 时 设置 
了 baseline 参数 ， 则 只 会 显示 发 生变 化 的 内 存 分 配点 。 例 如 : 


C:\>jremd 5784 print_memusage level=1 






































5784: 
Total mapped 1300092KB +25040KB (reserved= 
1090888KB -7496KB) 
- Java heap 1048576KB (reserved= 
1008068KB -11020KB) 
= GC tables 35084KB 
- Thread stacks 14336KB +3840KB (#threads=32 +9) 
- Compiled code 4928KB +1152KB (used=4774KB +1209KB) 
- Internal 1416KB +256KB 
- os 83040KB +2048KB 
- Other 50312KB +2448KB 
- JRockit malloc 27200KB +7424KB (malloced=25807KB 
+6236KB #266150 +63919) 
balance 44KB +9KB (#23 +5) 
breakpoints 9KB -8KB (#37 -255) 
breaktable 8KB +2KB (#13 +3) 
codealloc 56KB +25KB (#1037 +502) 
codeblock 143KB +39KB (#2567 +686) 
codeinfo 1224KB +351KB (#22300 +6404) 
codeinfotree 400KB +126KB (#74 +18) 
dynarray 116KB +30KB (#2058 +392) 
finalhandles 3KB +2KB (#14 +7) 
hashtable 32KB +32KB (#5 +3) 
implchange 982KB +354KB (#20920 +7556) 
javalock 279KB +266KB (#4477 +4092) 
libcache 245KB +47KB (#9473 +1840) 
libconstraints 22KB +3KB (#464 +75) 
lifecycle 14KB +4KB (#33 +9) 
livemap_system 1083KB +305KB (#25117 +5207) 
memleak_trends 544KB +544KB (#5809 +5809) 
memleakserver 96KB +96KB (#2906 +2906) 
metainfo 7669KB +1916KB (#21935 +6416) 








在 上 面 的 示例 中 ,JRockit Mission Control Memleak 工具 监视 了 命令 调用 , 可 以 看 到 Memleak 
自身 分 配 了 一 些 本 地 内 存 。 将 日 志 级 别 调 为 4， 可 以 看 到 更 详细 的 内 容 : 


C:\>jrcmd 5784 print memusage level=4 

5784: 

Total mapped 1310708KB +35656KB (reserved=1083664KB -14720KB) 
- Java heap 1048576KB (reserved=1002572KB -16516KB) 
- GC tables 35084KB 
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108KB 

+32KB (#27 +8) 

update_trends memleak_trends.c: 364 592KB 
+592KB (#3612 +3612) 

update_trends memleak_trends.c: 365 84KB 
+84KB (#3612 +3612) 

create id from_object memleakserver.c: 170 25KB 
+25KB (#1 +1) 

create id from classp memleakserver.c: 217 116KB 


最 后 ， 使 用 参数 displayMap 可 以 让 print _memusage 命令 显示 出 各 个 JVM 子 系统 的 内 
存 使 用 情况 : 


C:\>jremd 5784 print_memusage displayMap 














5784: 

Total mapped 1311220KB +36168KB (reserved=1083664KB - 
14720KB) 

- Java heap 1048576KB (reserved=1002572KB - 
16516KB) 

= Gc tables 35084KB 

= Thread stacks 14592KB +4096KB (#threads=33 +10) 

- Compiled code 5824KB +2048KB (used=5634KB +2069KB) 

= Internal 1160KB 

ai os 83180KB +2188KB 

- Other 52660KB +4796KB 

- JRockit malloc 30464KB +10688KB (malloced=29618KB 
+10047KB #302842 +100611) 

- Native memory tracking 2112KB +1088KB (malloced=1035KB 
+582KB #672 +308) 

- Java class data 37568KB +11264KB (malloced=37537KB 


+11243KB #45413 +14104) 
十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


CODE Compiled code rwx 0x0000000007ef0000 (128KB) 
MSP JRockit malloc (179/266) rw 0x0000000008150000 (64KB) 
THREAD Stack 6952 rwx 0x0000000008d80000 (12KB) 
INT TLA memcache rw 0x000000000e330000 (64KB) 
HEAP Java heap rw 0x0000000010040000 (46004KB) 
HEAP Java heap reserved 0x0000000012d2d000. (1002572KB) 
os *awt.d1ll r x 0x000000006d0b1000 


十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 十 


Lowest accessible address 00010000 
Highest accessible address 7FFEFFFF 
Amount free virtual memory 786016KB 


6 free vm areas in range 4KB - 8KB totalling > 24KB 

7 free vm areas in range 8KB - 16KB totalling > 76KB 
24 free vm areas in range 16KB - 32KB totalling >528KB 
281 free vm areas in range 32KB - 64KB totalling > 15MB 
3 free vm areas in range 64KB - 128KB totalling >236KB 

9 free vm areas in range 128KB - 256KB totalling > 1MB 

5 free vm areas in range 256KB - 512KB totalling > 1MB 
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7 free vm areas in range 512KB - 1MB totalling > 4MB 
8 free vm areas in range 1MB - 2MB totalling > 11MB 
2 free vm areas in range 2MB - 4MB totalling > 4MB 
5 free vm areas in range 4MB - 8MB totalling > 30MB 
1 free vm areas in range 8MB - 16MB totalling > 11MB 
5 free vm areas in range 16MB - 32MB totalling >103MB 
1 free vm areas in range 32MB - 64MB totalling > 51MB 
1 free vm areas in range 64MB - 128MB totalling > 67MB 
1 free vm areas in range 128MB - 256MB totalling >135MB 
1 free vm areas in range 256MB - 512MB totalling >326MB 


正如 示例 那样 ， 内 存 块 被 划分 为 以 下 几 类 。 

Q THREAD: 线程 相关 ， 例 如 线程 栈 。 

口 INT: 内 部 使 用 相关 ， 例 如 指针 页 (pointer page )。 
a HEAP: JRockit 中 的 Java HE, 
OOS: 直接 映射 到 操作 系统 的 内 存 ， 例 如 第 三 方 DLL 或 共享 对 象 。 

O MSP: 内 存 空间 ， 即 专用 的 本 地 堆 ， 例 如 JVM 内 部 分 配 的 本 地 内 存 。 
O GC: 垃圾 回收 相关 ,例如 存活 标记 位 (live bit )。 








tt 











11.4.17 print object summary 


该 命令 用 于 展示 堆 中 每 个 类 型 所 占用 的 内 存 , 因此 可 以 将 之 作为 一 个 精简 版 的 内 存 泄漏 检测 
工具 使 用 。 当 然 ，JRockit Mission Control Memory Leak Detector 比 该 命令 强大 得 多 ， 但 在 某 些 场 
景 下 , 使 用 该 命令 更 加 合适 。 例如 , 由 于 安全 策略 限制 , 无 法 开启 MLS (参见 第 10 章 相 关内 容 )， 
此 时 就 可 以 通过 该 命令 完成 相关 操作 。 

print_object_summary 命令 会 打印 出 堆 中 实例 的 直方 图 ， 按 照 每 种 类 型 统计 其 实例 所 占 
有 的 内 存 空 间 ， 以 及 从 上 一 次 执行 命令 之 后 实例 占用 内 存 的 增 量 值 。 

C:\>jrcmd 6328 print object summary 

6328: 


人 Detailed Heap Statistics: --------- 
22.1% 2697k 34813 +2697k [C 
% 









































= 











14.3% 1744k 373 +1744k [B 
14.2% 1736k 3220 +1736k [Ljava/lang/Object; 
11.8% 1443k 2177 +1443k [I 

6.9% 839k 35833 +839k java/lang/String 

5.6% 682k 6240 +682k java/lang/Class 

2.6% 314k 13429 +314k java/util/HashMap$Entry 
2.0% 242k 3218 +242k [Ljava/util/HashMap$Entry; 
1.2% 149k 3185 +149k java/util/HashMap 

1.0% 126k 5406 +126k java/util/Hashtable$Entry 
0.9% 106k 2844 +106k [Ljava/lang/String; 

0.8% 98k 1396 +98k java/lang/reflect/Field 
0.5% 65k 844 +65k java/lang/reflect/Method 
0.5% 64k 190 +64k [S 


12192kB total --- 


--------- End of Detailed Heap Statistics --- 


KE J 
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输出 内 容 中 按照 每 种 类 型 统计 了 内 存 使 用 的 相关 数据 。 
口 第 1 列 是 当前 类 型 的 所 有 实例 所 占用 的 堆 空 间 的 百分比 ; 
口 第 2 列 是 当前 类 型 的 所 有 实例 所 占用 的 堆 空 间 的 大 小 ; 
O 第 3 列 是 当前 类 型 的 所 有 实例 的 个 数 ; 
O 第 4 列 是 自从 上 次 调用 该 命令 之 后 内 存 占 用 的 增 量 值 ; 
D 第 5 列 是 类 型 名 。 











在 列 出 类 型 名 时 , 使 用 的 是 正式 的 Java 描述 符 格 式 。 更 多 相关 信息 ， 
列 出 占用 内 存 0.5% 以 上 的 
输出 结果 , 将 百分比 乘 以 1000 作为 参数 值 即 可 。 例如， 车 想 列 出 占用 内 存 1.2% 以 上 的 类 型 ， 








命令 只 会 


正常 情况 下 ,该 
参数 cutoff 设置 为 1200 即 可 。 
还 可 以 使 月 
points-to 找 出 到 底 是 哪些 实例 指向 了 




















有 时 候 会 简单 地 将 参数 名 设置 为 namel 到 names, 





型 的 内 存 使 用 信息 。 


在 下 面 的 示例 中 ， 列 出 了 指向 字符 数组 和 字 名 


aw 


AL 


自 


Bs 


Po bly 


子 付 





请 参见 Java 语言 规范 。 
修改 参数 cutoff 的 值 可 以 调整 
将 


类 型 。 





H print_object_summary 命令 玩 些 花样 。 就 上 面 的 示例 来 说 ， 可 以 使 用 参数 








数组 。 最 多 可 以 指定 8 个 不 同 的 points-to BR, 
再 指定 具体 的 参数 值 就 可 以 列 出 指向 这 些 类 




















A =I 
中 


入、 内 存 占用 大 于 0.1% 的 实例 的 内 存 使 用 





D 


C:\>jremd 6352 print_object_summary cutoffpointsto=100 
namel=[C name2=java/lang/String 


结果 如 下 所 示 。 


Detailed Heap Statistics: 


42.0% 10622k 116820 +0k [C 
11.3% 2851k 121648 

6.0% 1520k 3676 

4.1% 1033k 18906 


registry/ReferenceMap$SoftRef 


3.5% 890k 38001 
3.2% 800k 7323 
3.0% 747k 19820 
2.9% 741k 10063 +0k [I 
2.9% 738k 15765 


registry/ConfigurationElement 


2.8% 699k 15469 
1.1% 284k 262 +0k [B 
1.0% 241k 4411 


+0k java/lang/String 

+0k [Ljava/util/HashMap$Entry; 
+12k org/eclipse/core/internal/ 
+0k java/util/HashMapsEntry 
+0k java/lang/Class 

+0k [Ljava/lang/String; 

+0k org/eclipse/core/internal/ 


+0k [Ljava/lang/Object; 


+1k org/eclipse/osgi/internal/ 


resolver/ExportPackageDescriptionImpl 


0.7% 173k 7408 
0.7% 171k 3653 
0.6% 148k 734 
0.5% 129k 2 


registry/ReferenceMap$IEntry; 
25273kB total --- 


[C is pointed to from: 


+0k org/osgi/framework/Version 
+0k java/util/HashMap 

+0k [Ljava/util/HashtablesEntry; 
+0k [Lorg/eclipse/core/internal/ 
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- 6% 121713 java/lang/String 
2% 270 [[c 


java/lang/String is pointed to from: 


37.2% 98288 [Ljava/lang/String; 

15.6% 41274 java/util/HashMapSEntry 

11.9% 31530 org/eclipse/core/internal/registry/ 
ConfigurationElement 

7.2% 19067 [Ljava/lang/Object; 


--------- End of Detailed Heap Statistics --- 


从 上 面 的 示例 可 以 看 出 , 大 部 分 字符 数组 都 被 字符 串 对 象 引用 , 而 字符 串 对 象 又 主要 是 被 字 
符 串 对 象 引用 。 这 很 正常 。 

该 命令 通常 用 于 查看 堆 中 实例 的 分 布 情况 ,此 外 ,也 可 以 追踪 指定 类 型 的 内 存 使 用 增 量 信息 ， 
配置 points-to 参数 更 有 利于 查找 内 存 泄漏 问题 。 不 过 ， 查 找 内 存 泄漏 问题 ,还 是 Memleak 更 
加 强大 ， 具 体 用 哪个 ， 依 赖 于 具体 的 场景 。 


参见 heap_diagnostics 命令 。 




















Ut 















































11.4.18 print properties 


该 命令 用 于 输出 JRockit 的 属性 信息 ， 包 括 启动 JVM 时 的 初始 属性 ， 专 用 于 JRockit JVM 的 
属性 ， 以 及 当前 系统 属性 。 这 3 部 分 信息 会 分 开 输 出 ， 如 下 所 示 : 


C:\>jrcmd 6012 print properties 

6012: 

=== Initial Java properties: === 

java.vm.specification.name=Java Virtual Machine Specification 

java.vm.vendor.url.bug=http://edocs.bea.com/ 
jrockit/go2troubleshooting.html 

java.home=D: \demos_3.1\jrmc_3.1\jre 

java.vm.vendor.url=http://www.bea.com/ 

java.vm.specification.version=1.0 

file.encoding=Cp1252 

java.vm.info=compiled mode 














=== End Initial Java properties === 


=== VM properties: === 

jrockit.alloc.prefetch=true 
jrockit.alloc.redoprefetch=true 
jrockit.vm=D:\demos_3.1\jrmc_3.1\jre\bin\jrockit\jvm.d1l 
jrockit.alloc.pfd=448 

jrockit.alloc.pf1=64 

jrockit.alloc.cs=512 
jrockit.vm.dir=D:\demos_3.1\jrmc_3.1\jre\bin\jrockit 
jrockit.alloc.cleartype=0 

=== End VM properties === 





=== Current Java properties: === 
java.vm.vendor.url.bug=http://edocs.bea.com/ 
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jrockit/go2troubleshooting.html 
java.runtime.name=Java(TM) 2 Runtime Environment, Standard Edition 
sun.boot.library.path=D:\demos_3.1\jrmc_3.1\jre\bin 
java.vm.version=R27.6.3-40_0-112056-1.5.0_17-20090318-2104-windows-ia32 
java.vm.vendor=BEA Systems, Inc. 
java.vendor.url=http://www.bea.com/ 
path.separator=; 
java.vm.name=BEA JRockit (R) 
file.encoding.pkg=sun.io 
user.country=SE 


=== End Current Java properties === 


| 受 输出 的 结果 中 可 能 会 包含 重复 属性 设置 ， 因 为 某 些 属性 可 能 会 同时 存在 于 


initial 和 current 部 分 的 内 容 中 。 


11.4.19 print threads 


JVM 对 stcour 信和 号 的 默认 处 理 就 是 打印 所 有 线程 的 调用 栈 信 息 。 市 面 上 有 很 多 可 以 分 析 
线程 调用 栈 信 息 的 工具 , 不 过 最 好 用 的 仍旧 是 Latency Analysis 和 JFR. 此 外 , JRockit Management 
Console 也 可 以 做 一 些 简单 的 分 析 工 作 ， 甚 至 能 检测 死 锁 。 

该 命令 的 使 用 示例 如 下 所 示 : 


C:\>jrcmd 7420 print_threads 
7420: 





























===== FULL THREAD DUMP =============== 
Mon Sep 28 00:08:56 2009 
Oracle JRockit(R) R28.0.0-547-121310-1.6._14-20090918-2121-windows-ia32 
"Main Thread" id=1 idx=0x4 tid=7776 prio=6 alive, in native 
at org/eclipse/swt/internal/win32/0S.WaitMessage()Z 
(Native Method) [optimized] 
at org/eclipse/swt/widgets/Display.sleep(Display.java:4220) [inlined] 
at org/eclipse/ui/application/WorkbenchAdvisor.eventLoopIdle 
(WorkbenchAdvisor.java:364) [optimized] 
at org/eclipse/ui/internal/Workbench.runEvent Loop (Workbench. java:2385) 
at va. 
-- end of trace 


"State Data Manager" id=13 idx=0x38 tid=7596 

prio=5 alive, sleeping, native_waiting, daemon 

at java/lang/Thread.sleep(J)V(Native Method) [optimized] 

at org/eclipse/osgi/internal/baseadaptor/ 
StateManager.run(StateManager.java:297) 

at java/lang/Thread.run(Thread.java:619) 

at jrockit/vm/RNI.c2java(IIIII)V(Native Method) [optimized] 

-- end of trace 
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"JFR request timer" id=34 idx=0x84 tid=2624 
prio=5 alive, waiting, native_blocked, daemon 
-- Waiting for notification on: java/util/ 
TaskQueue@0x1202F238[fat lock] 
at jrockit/vm/Threads.waitForNotifySignal 
(JLjava/lang/Object;)Z(Native Method) [optimized] 
at java/lang/Object.wait(J)V(Native Method) 
at java/lang/Object.wait (Object.java:485) 
at java/util/TimerThread.mainLoop (Timer. java:483) 
4-- Lock released while waiting: java/util/ 
TaskQueue@0x1202F238[fat lock] 
at java/util/TimerThread.run(Timer.java:462) 
at jrockit/vm/RNI.c2java(IIIII)V(Native Method) [optimized] 
-- end of trace 
===== END OF THREAD DUMP =============== 


默认 情况 下 ， 该 命令 不 会 打印 线程 调用 栈 中 调用 本 地 方法 的 栈 帧 ， 若 想 输出 这 部 分 内 容 ,， 需 
要 添加 参数 nativestack=true。 此 外 , 若 想 在 输出 内 容 中 加 上 有 关 kar .util.concurrent 
包 中 锁 实 现 的 相关 信息 ， 需 要 添加 参数 concurrentlocks=true。 








11.4.20 print utf8pool 


该 命令 用 于 打印 出 JVM 中 所 有 的 UTF-8 常量 ， 例 如 类 名 、 方 法 名 和 字符 串 常量 。 
下 面 的 示例 中 列 出 了 常量 池 中 所 有 的 URL: 

$ jrcmd 3824 print_utf8pool | grep http 

"http: //www.w3.org/TR/xinclude": refs=2, len=29 


"http: //apache.org/xml/properties/internal/ 
symbol-table": refs=12, len=54 


其 中 ，refs 是 指向 该 常量 的 引用 的 数目 ，len 指 的 是 以 字 节 计算 的 常量 值 的 长 度 。 









































11.4.21 print vm state 


该 命令 用 于 打印 JVM 的 状态 ， 其 格式 与 JRockit 宕 机 时 生成 的 转 储 文件 类 似 。 如 下 所 示 : 


C:\>jrcmd 7420 print vm state 





7420: 
Uptime : 0 days, 02:35:53 on Tue Sep 22 19:14:39 2009 
Version : Oracle JRockit(R) R28.0.0-547-121310 
-1.6.0_14-20090918-2121-windows-ia32 
CPU : Intel Core 2 SSE SSE2 SSE3 SSSE3 SSE4.1 Core Intel6é4 | 
Number CPUs : 2 
Tot Phys Mem : 3706712064 (3534 MB) 
OS version : Microsoft Windows Vista version 6.0 Service Pack 2 


(Build 6002) (32-bit) 
Thread System: Windows Threads 
Java locking : Lazy unlocking enabled (class banning) (transfer banning) 
State : JVM is running 
Command Line : -Denv.class.path=.;C:\Program Files\ 
Java\jre6\lib\ext\QTJava.zip -Dapplication.home=C: \ 
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jrockits\R28.0.0_R28.0.0-547_1.6.0 -client - 
XX:UnlockInternalVMOptions=true -Dsun.java.launcher= 
SUN_STANDARD com.jrockit.mc.rcp.start.MCMain 

java.home : C:\jrockits\R28.0.0_R28.0.0-547_1.6.0\jre 

j.class.path : C:\jrockits\R28.0.0_R28.0.0- 
547_1.6.0/missioncontrol/mc.jar 

j.lib.path : C:\jrockits\R28.0.0_R28.0.0- 


StackOverFlow: 0 StackOverFlowErrors have occured 


OutOfMemory : 0 OutOfMemoryErrors have occured 

C Heap : Good; no memory allocations have failed 

GC Strategy : Mode: pausetime, with strategy: singleconcon 
(basic strategy: singleconcon) 

GC Status : OC is not running. Last finished OC was OC#369. 

Heap : 0x10040000 - 0x17207000 (Size: 113 MB) 

Compaction : (no compaction area) 

CompRefs : References are 32-bit. 


Loaded modules: 
0000000000400000-000000000043afff C:\jrockits\ 
R28.0.0_R28.0.0-547_1.6.0\bin\jrmc.exe 
0000000077d30000-0000000077e56f£F C:\Windows\ 
system32\ntd1l1.d11 
00000000763£0000-00000000764cbf£fE 
0000000077a30000-0000000077accf£fE 
0000000077400000-000000007744afff 
0000000077ea0000-0000000077£65fFLEF 


: \Windows\system32\kernel132.d1l1 
: \Windows\system32\USER32.d11 

: \Windows\system32\GD1I32.d11 

: \Windows\system32\ADVAPI32.d11 


qgaaqaaqaa 


00000000764e0000-00000000765a2ff£F C:\Windows\system32\RPCRT4.d11 
000000006d3e0000-000000006d3feffF C:\jrockits\ 
R28.0.0_R28.0.0-547_1.6.0\jre\bin\java.d1l 


输出 内 容 与 SVM 状态 相关 ， 例 如 版 本 、 锁 、 线 程 、 路 径 、 载 入 的 模块 和 动态 库 等 。 


参见 heap_diagnostics 命令 。 


11.4.22 run optfile (R27) 


正如 在 第 2 章 中 介绍 的 , 在 启动 JVM 时 ,可 以 通过 指令 文件 为 JVM 优化 管理 器 提供 相关 参 
数 。 此 外 ， 还 可 以 在 运行 时 通过 run_opt file 命令 来 动态 添加 相关 参数 ， 通 过 参数 filename 
指定 所 需 的 指令 文件 。 需 要 注意 的 是 , R27 和 R28 版 本 所 支持 的 指令 文件 的 格式 有 些 区 别 。 此 外 ， 
对 于 R27 版 本 来 说 ， 由 于 指令 文件 并 没有 正式 的 说 明文 档 ， 可 能 只 会 在 通过 JRockit 官方 支持 时 
才 会 用 到 它 。 



























































11.4.23 run_optfile (R28) 


R28 版 本 中 的 run_opt file 命令 可 以 接收 多 个 参数 ， 其 中 最 重要 的 仍然 是 filename, 用 
于 指定 指令 文件 。R28 版 本 中 ， 指 令 文件 依旧 没有 正式 说 明文 档 ， 其 具体 格式 可 能 会 在 后 续 的 版 
本 中 发 生变 化 。 在 第 2 章 中 ,介绍 了 有 关 指 令 文 件 相 关内 容 ， 只 不 过 还 不 完整 。 
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run_optfile 命令 还 可 以 按 指定 策略 重新 编译 指定 的 方法 。 
在 下 面 的 示例 中 ， 会 按照 优化 编译 策略 ， 重 新 编译 jav.util.ArrayList#get 方法 。 


C:\>jremd 7736 run_optfile method=java.util.ArrayList.get* 
strategy=opt disass=false 



































11.4.24 runfinalization 


该 命令 用 于 强制 JVM 执行 java.lang.System#runFinalization 方法 ， 即 提示 运行 时 
应 该 要 运行 某 些 对 象 的 finalize 方法 了 。 


11.4.25 runsystemgc 


该 命令 用 于 强制 执行 一 次 Full GC。 

强制 执行 垃圾 回收 是 非常 少见 的 案例 ， 因 为 JVM 本 身 可 以 决定 什么 时 候 该 进行 垃圾 回收 。 
如 果 用 户 干预 这 个 过 程 , 反而 可 能 会 降低 执行 性 能 。 但 在 某 些 场景 下 ， 显 式 调 用 垃圾 回收 方法 是 
有 用 处 的 ， 例 如 ， 通 过 详细 的 垃圾 回收 日 志 来 查看 内 存 使 用 情况 和 存活 对 象 集 。 

使 用 该 命令 时 ,， 若 不 添加 参数 ， 则 默认 只 会 执行 年 轻 代 垃圾 回收 ， 而 不 会 对 推 做 内 存 整 理 操 
作 。 知 要 触发 一 次 Full GC， 则 需要 添加 参数 ful1=true。 如 下 所 示 : 


C:\>jremd 4748 runsystemgc full=true 
4748: 


该 命令 不 会 返回 任何 信息 。 









































11.4.26 set _vmflag (R28) 
该 命令 用 于 设置 VM 参数 。 如 下 所 示 : 


C:\>jrcmd 7772 set_vmflag flag=DumpOnCrash value=false 
7772: 


成 功 执行 后 ， 该 命令 不 会 返回 任何 信息 。 若 是 对 只 读 参 数 执行 写 操作 , 会 返回 错误 信息 ， 如 
下 所 示 : 

C:\>jrcmd 7772 set vmflag flag=DisableAttachMechanism value=true 

7772: 

Not a writeable flag "DisableAttachMechanism" 

若 想 修改 那些 在 运行 时 不 可 修改 的 VM 参数 ， 需 要 在 启动 JVM 时 ， 通 过 类 似 -XX:<Flag>= 
<value> 形 式 的 语法 来 设置 参数 。 


参见 list_vmflags 命令 。 





























11.4.27 start_flightrecording (R28) 


start_flightrecording 命令 用 于 启动 JFR 记录 任务 ， 可 以 是 持续 性 任务 或 计时 任务 。 
使 用 JROCKIT_HOME/jre/lib/jfr 目录 下 的 命名 模板 文件 (JSON 格式 ， 可 以 被 复制 和 修改 以 创建 
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新 的 模板 )， 可 以 对 记录 任务 做 具体 配置 。 


C:\>jremd 7420 start_flightrecording name=MyRecording settings= 
jra.jfs duration=30s filename=my_recording.jfr.gz compress=true 

7420: 

Started recording 5 


在 上 面 的 示例 中 ， 通 过 命令 名 ， 使 用 jrajf 模板 开启 了 一 个 持续 30 秒 的 记录 任务 ,记录 结 
后 , 会 在 JROCKIT_HOME 目录 下 生成 一 个 名 为 my_recording.jfr.gz 的 压缩 过 的 记录 文件 。 

使 用 check_flightrecording fi 命令 可 以 在 记录 开始 后 检查 记录 任务 的 执行 情况 : 

C:\>jremd 7420 check_flightrecording 

7420: 

Recording : id=0 name="continuous" duration=0s (running) 


Recording : id=5 name="MyRecording" duration=30s 
dest="my_recording.jfr.gz" compress=true (running) 


在 30 秒 过 后 ， 记 录 任 务 的 状态 会 从 running 变 为 stopped， 并 生成 记录 文件 。 

有 些 模板 只 能 是 附加 的 , 即 它们 必须 和 其 他 基础 模板 一 起 使 用 , 这 类 模板 在 其 文件 开头 的 注 
释 信 息 中 做 了 说 明 。 如 果 注 释 信 息 以 Additional setting 开头 ， 则 说 明 它 是 附加 模板 。 使 用 方式 如 
下 所 示 : 


C:\>jrcmd 7420 start_flightrecording name=DefaultAndLocks 
settings=default.fls settings=lock.fls duration=30s 
filename=defaultAndLocks.jfr.gz compress=true 


就 操作 JFR 来 说 ， 最 简单 的 方式 还 是 使 用 JRockit Mission Control 客户 端 。 更 多 有 关 JFR 的 
信息 J 9 请 参 参见 第 9 章 o 



















































































| ŞS 压缩 文件 可 能 会 带 来 些 领 外 的 开销 ， 但 会 缩减 文件 大 小 。 


参见 命令 check _flightrecording, dump_flightrecording 和 stop_flightrecording。 


11.4.28 start management server 


该 命令 用 于 在 没有 启动 脚本 重启 JVM 的 情况 下 ， 开 启 外 部 管理 代理 。 其 具体 实现 与 使 用 
-Xmanagement 参数 开启 管理 代理 相同 。 

启动 应 用 程序 服务 器 , 部署 J2EE 应 用 程序 可 能 需要 花费 相当 长 的 时 间 , 而 且 JVM 热身 又 需 
要 花费 一 段 时 间 ， 因 此 ， 若 是 在 启动 JVM 时 忘记 添加 参数 配置 是 很 令 人 恼火 的 。 如 果 是 生产 环 
境 的 服务 器 ， 重 启 就 更 麻烦 了 。 

在 下 面 的 示例 中 ， 通 过 该 命令 在 4711 端口 开启 了 一 个 外 部 管理 代理 ， 关 闭 了 SSL 和 身份 校 
w, 开启 了 自动 发 现 。 需 要 注意 的 是 ， 这 里 需要 提前 配置 好 password.properties 文件 和 密 钥 文件 。 
更 多 详细 内 容 ， 请 参见 Oracle Sun Developer Network 中 Monitoring and Management Using JMX 
Technology 的 内 容 。 
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C:\>jremd 473528 start_management_server ssl=false 
authenticate=false port=4711 autodiscovery=true 
2416: 


Fan TET MO, AE HAA E 








< start_management_server 命令 总 是 会 启动 一 个 本 地 管理 代理 ， 而 在 开 
局 本 地 代理 之 后 ， 就 不 能 被 关闭 了 。 


人 参见 kill_management_server 命令 。 


\\ 





11.4.29 startjrarecording (R27) 


操作 JRA 记录 ， 最 好 是 通过 JRockit Mission Control 客户 端 。 更 多 有 关 这 方面 的 信息 ， 请 参 
见 第 8 章 。 

不 过 在 某 些 场景 下 , 可 能 无 法 使 用 JRockit Mission Control 客户 端 , 例如 环境 不 允许 使 用 JMX 
连接 , 或 者 使 用 的 是 JDK 1.4 版 本 等 。 这 时 ， 就 该 startjrarecording 命令 出 场 了 。 在 下 面 的 
示例 中 ， 通 过 命令 行 在 进程 号 5516 的 JRockit 进程 中 开启 了 一 个 JRA 记录 任务 ,任务 持续 2 分 
ee ne 

在 对 使 用 大 量 框架 ， 或 使 用 企业 容器 ( 例如 WebLogic ) 的 应 用 程序 做 采样 时 ， 调 用 栈 通常 都 
很 深 . 这 时 需要 通过 配置 参数 来 调整 采样 信息 。 在 下 面 的 示例 中 ， 将 调用 栈 的 采集 深度 设置 为 64。 

参数 sampletime 用 于 指定 线程 采样 的 频率 。 由 于 示例 中 采样 的 持续 时 间 很 得 ， 将 采样 频 
率 设置 为 5 毫秒 一 次 ， 同 时 开启 对 延迟 事件 的 记录 。 

C:\>jremd 5516 startjrarecording filename=C:\myrecording.jra 

recordingtime=120 delay=30 tracedepth=64 sampletime=5 latency=true 


5516: 
JRA recording started. 


开始 执行 命令 后 ，JVM 会 在 控制 台 开 始 打印 如 下 相关 内 容 : 


[INFO ] [jra ] Delaying JRA recording for 30 seconds. 

[INFO ] [jra ] Starting JRA recording with these options: 

filename=D:\myrecording.jra, recordingtime=120s, methodsampling=1, 
gcsampling=1, heapstats=1, nativesamples=0, methodtraces=1, 
sampletime=5, zip=1, hwsampling=0 delay=30s, tracedepth=64 
threaddump=1, threaddumpinterval=0s, latency=1, 
latencythreshold=20ms, cpusamples=1, cpusampleinterval=1s 


在 记录 结束 后 ，JVM 会 打印 类 似 下 面 的 内 容 : 


[INFO ] [jra ] Zipped the recording file. 
[INFO ] [jra ] Finished recording. Results written to 
C:\myrecording.jra. 




















































































































参见 命 fy & checkjrarecording 和 stopjrarecordings 
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11.4.30 stop _flightrecording (R28) 














该 命令 用 于 终止 进行 中 的 JFR 记录 任务 ， 目 标 任务 可 以 通过 参数 name 或 recording 来 指 
定 。 如 下 所 示 : 


C:\>jrcmd 7420 stop_flightrecording recording=10 
7420: 


默认 情况 下 ， 被 终止 的 记录 任务 会 生成 转 储 文件 。 如 果 不 想 保 留 记 录 数 据 ， 可 以 添加 参数 
discard=true。 终止 任务 时 ,会 将 目标 记录 从 check_flightrecording 命令 的 输出 列表 中 
移 除 ， 因 此 可 以 使 用 该 命令 清理 不 再 需要 的 记录 任务 。 


参见 命令 check_flightrecording, dump flightrecording 和 start_flightrecording。 














11.4.31 timestamp 


该 命令 用 于 打印 时 间 戳 ， 并 显示 出 JVM 已 经 运行 的 持续 时 间 。 


C:\>jremd 6012 print_properties 

6012: 

==== Timestamp ==== uptime: 0 days, 00:04:39 time: 
Sun Jan 24 15:47:42 2010 


11.4.32 verbosity 


该 命令 用 于 控制 Rockit 中 的 日 志 模块 , 它 可 以 针对 某 个 子 系统 调整 日 志 级 别 , 重 定向 日 志 输 
出 ， 以 及 调整 日 志 输出 内 容 。 执 行 该 命令 时 , 若 不 添加 额外 的 参数 , 则 会 列 出 当前 所 有 日 志 模块 。 


C:\demos_3.1>jremd 4504 verbosity 

4504: 

Current logstatus: 
jrockit : level=WARN, decorations=201, sanity=NONE 
memory (gc) : level=WARN, decorations=201, sanity=NONE 
nursery (yc) : level=WARN, decorations=201, sanity=NONE 
model : level=WARN, decorations=201, sanity=NONE 
devirtual : level=WARN, decorations=201, sanity=NONE 
codegen (code) : level=WARN, decorations=201, sanity=NONE 
native (jni) : level=WARN, decorations=201, sanity=NONE 
thread : level=WARN, decorations=201, sanity=NONE 
opt : level=WARN, decorations=201, sanity=NONE 


具体 输出 内 容 中 ， 每 行 的 第 一 个 单词 是 模块 名 ， 圆 括号 中 的 是 模块 的 别名 。 
下 面 的 示例 中 ,启用 了 代码 生成 器 模块 (参见 第 2 章 内容 ) 的 常规 输出 ， 其 具体 效果 , 与 
动 JVM 时 添加 -xverbose:codegen 参数 相同 。 












































Ùl 





C:\>jremd 5556 verbosity set=codegen=INFO 

5556: 

Current logstatus: 
jrockit : level=WARN, decorations=201, sanity=NONE 
memory (gc) : level=WARN, decorations=201, sanity=NONE 
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nursery (yc) : level=WARN, decorations=201, sanity=NONE 
model : level=WARN, decorations=201, sanity=NONE 
devirtual : level=WARN, decorations=201, sanity=NONE 
codegen (code) : level=INFO, decorations=201, sanity=NONE 


正如 示例 中 所 展现 的 ， verbose 命令 列 出 了 新 的 日 志 状 态 。 

verbosity 命令 还 可 用 于 做 异常 分 析 ， 找 出 异常 是 在 何 处 抛 出 的 。 

在 R28 版 本 之 前 ， 那 时 JFR 还 不 和 做 异常 分 析 ， 唯 一 的 方法 就 是 查 日 志 ， 在 启动 JVM 时 ， 
添加 人 参数- Xverbose:exceptions (参见 第 5 草 相关 内 容 )。 

下 面 的 示例 展示 了 如 何 开 启 和 关闭 异常 分 析 ， 以 及 如 何 调整 输出 内 容 。 若 将 参数 
decorations 置 空 ， 则 默认 会 调整 时 间 戳 、 模 块 名 和 进程 号 的 输出 

C:\>jremd 6064 verbosity set=exceptions=info decorations=module 


6064: 
Current logstatus: 


之 后 ， 若 目标 JVM 进程 抛 出 异常 ExceptionThrowerException， 则 会 打印 信息 “Throw 


me!” 。 


























[excepti] ExceptionThrowerException: Throw me! 
[excepti] ExceptionThrowerException: Throw me! 


将 日 志 级 别 设置 为 depug 后 ， 耻 ockit 会 显示 出 异常 的 调用 栈 : 


D:\>jremd 6064 verbosity set=exceptions=debug decorations=module 
6064: 
Current logstatus: 


其 效果 与 启动 JVM 时 添加 -xverbose:exceptions=debug 相同 : 








[excepti] ExceptionThrowerException: Throw me! 

at jrockit/vm/Reflect.fillInStackTrace0 
(Ljava/lang/Throwable; )V(Native Method) 

at java/lang/Throwable.filliInStackTrace() 
Ljava/lang/Throwable; (Native Method) 

at java/lang/Throwable.<init> (Throwable. java:196) 

at java/lang/Exception.<init> (Exception. java:41) 

at ExceptionThrowerException.<init>(ExceptionThrowerException.java:5) 

at ExceptionThrower.throwMe (ExceptionThrower.java:24) 

at ExceptionThrower.doStuff (ExceptionThrower.java:20) 

at ExceptionThrower.loop(ExceptionThrower.java:11) 

at ExceptionThrower.main(ExceptionThrower.java:4) 

at jrockit/vm/RNI.c2java(IIIII)V(Native Method) 

--- End of stack trace 


这 样 就 可 以 在 生产 环境 中 对 日 志 进 行 配 置 了 ,在 异常 分 析 完 成 后 , 可 以 将 日 志 级 别 设置 还 
不 会 产生 额外 的 执行 开销 。 








11.4.33 version 


该 命令 用 于 在 不 重启 应 用 程序 服务 器 的 情况 下 查看 JRockit 的 具体 版 本 ,例如 ,已 经 将 JRockit 
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My 


JVM 注册 为 系统 服务 ， 没 有 控制 台 可 用 ， 就 可 以 通过 该 命令 查看 JRockit JVM 的 具体 版 本 信息 。 


使 用 该 命令 时 ， 无 须 添加 额外 的 参数 。 


C:\>%JAVA_HOME%\bin\jrcemd 2416 version 

2416: 

BEA JRockit(R) (build R27.6.2-20_0-108500-1.6.0_05- 
20090120-1116-windows-ia32, compiled mode) 








11.5 h 


本 章 介 绍 了 IRCMD 命令 行 工 具 ， 它 可 以 列 出 系统 上 正在 运行 的 所 有 JRockit JVM， 并 向 一 
个 或 多 个 JRockit JVM 实例 发 送 诊断 命令 。 

本 章 通过 示例 讲解 了 其 具体 命令 的 使 用 方式 和 相关 输出 内 容 。 

命令 参考 部 分 的 内 容 按照 字母 表 顺 序列 出 ， 可 以 作为 参考 指南 使 用 。 























JRockit Management/API 








JRockit 的 管理 功能 非常 有 用 ， 访 问 方式 也 有 很 多 ， 但 它们 并 未 写 入 到 正式 的 文档 中 ， 因 此 
在 不 同 的 JRockit 版 本 之 间 可 能 有 所 不 同 。 应 用 程序 若 依赖 于 这 些 API， 则 可 能 无 法 部 署 在 所 有 
的 JRockit 版 本 中 。 尽 管 如 此 ， 本 章 还 是 会 介绍 其 中 一 些 API， 因 为 它们 确实 非常 有 用 。 

本 章 主 要 包含 以 下 内 容 : 

口 如 何 通过 JRockit Management API ( JMAPI ) 访问 Rockit JVM 中 的 运行 时 信息 ; 
口 如 何 初始 化 并 访问 不 同 版 本 JRockit 中 的 JMX-based JRockit Management API ( JMXMAPI )。 


| 在 JRockit R28 版 本 中 , JMAPI 已 经 被 部 分 废弃 了 , 而 JRockit 的 所 有 版 本 都 | 
& 


























经 不 再 支持 JMXMAPI。 本 章 内 容 只 做 学 习 介 绍 之 用 。 


12.1 JMAPI 


本 章 首先 介绍 一 下 JMAPI， 它 是 一 个 轻 量 级 的 纯 Java 的 API， 提 供 了 在 进程 内 访问 管理 特 
性 的 功能 。 在 TRockit 早期 的 版 本 中 就 已 经 存在 该 API, 但 在 R28.0.0 版 本 中 , 该 API 已 经 被 部 分 

JMAPI 是 JVM 内 部 的 API， 可 算 作 是 早期 版 本 的 JRockit Management Console。 事 实 上 ， 即 
使 在 今天 ， 若 是 连接 到 JRockit 1.4 版 本 的 JVM 实例 ， 使 用 的 仍然 是 名 为 Rockit Management 
Protocol (RMP) 的 私有 协议 ， 而 该 协议 就 是 使 用 JMAPI 来 收集 和 修改 运行 时 信息 的 。 

接 下 来 介绍 几 个 使 用 JMAPI 的 示例 。 若 想 编译 这 些 示 例 , 最 简单 的 方式 是 使 用 JRockit JDK。 
编译 时 无 须 做 特殊 配置 ， 因 为 所 需 的 类 都 在 JRockit JDK 的 rtjar 包 中 。 在 编译 示例 的 时 候 ， 也 可 
以 加 上 jmapijar 包 ， 它 包含 了 所 有 接口 声明 。jmapijar 包 不 是 JDK 的 一 部 分 ， 是 由 Oracle 单独 发 
行 的 。 

使 用 JMAPI 来 完成 一 些小 任务 是 非常 简单 的 ,com.bea. jvm.JVMFactory 类 可 以 得 到 实现 

了 JVM 接口 的 实例 ， 通 过 该 实例 就 可 以 访问 到 JVM 的 各 个 子 系统 了 ， 如 下 图 所 示 。 
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2008 年 ，Oracle 收购 了 BEA 公司 , 而 JMAPI 是 在 此 之 前 出 现 的 ， 因 此 类 的 
GS | 包 名 中 会 含有 com.beasOracle 在 收购 了 BEA 之 后 ,将 JMAPI 用 在 了 其 他 Oracle 
产品 和 一 些 第 三 方 产品 上 。 由 于 JRockitR27 及 其 之 前 的 版 本 均 支 持 JMAPI， 所 

路 响 已 有 的 产品 ， 包 名 中 的 com.bea 就 被 保留 了 下 来 。 


在 下 面 的 示例 中 , 会 在 控制 台 上 打印 出 系统 当前 的 CPU 负载 , 共 打印 10 次 , 每 次 间隔 1 秒 钟 。 
import com.bea.jvm.JVMFactory; 


public class JMAPITest { 
public static void main(String[] args) throws InterruptedException { 
for (int i = 0; i < 10; i++) { 
System.out.printin ( 
String.format ("CPU load is %3.2f%%", 
JVMFactory.getJVM().getMachine().getCPULoad() * 100.0)); 
Thread.sleep(1000); 
} 
} 
} 


访问 JMAPI 需要 配置 相关 权限 ， 不 过 无 法 细 粒 度 地 设置 权限 ， 只 能 全 部 允许 或 全 部 禁 
若是 启用 了 安全 管理 器 ( security manager )， 则 需要 为 com.bea.jvm.Management Permission 
授予 createInstance 权限 。 如 下 所 示 : 


grant { 
permission com.bea.jvm.ManagementPermission "createInstance"; 




















docs/guide/security/permissions.html. 


| GS 更 多 有 关 权 限 与 安全 控制 方面 的 内 容 ， 请 参见 http://java.sun.com/j2se/1.5.0/ 
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JMAPI 示例 


JMAPI 可 用 于 收集 有 关 操 作 环 境 的 各 种 信息 。 下 面 的 示例 演示 了 如 何 通过 JMAPI 来 获取 有 
关 网 络 接口 的 信息 。 


for (NIC nic : JVMFactory.getJUVM().getMachine().getNICs()) { 
System.out.println ( 
nic.getDescription() + " MAC:" + 
nic.getMAC() + " MTU:" + nic.getMTU()); 





还 可 以 使 用 JMAPI 修改 运行 时 参数 。 在 下 面 的 示例 中 ， 会 修改 CPU 亲 和 性 ， 将 JRockit 进 
旦 中 的 线程 都 绑 定 到 一 个 CPU Eo 
private static void bindToFirstCPU(JVM jvm) { 
Collection<CPU> cpus = jvm.getProcessAffinity(); 
CPU cpu = cpus.iterator().next(); 
Collection<CPU> oneCpu = new LinkedList<CPU>(); 
oneCpu.add(cpu) ; 
jvm.suggestProcessAffinity (oneCpu) ; 


} 


上 面 示例 所 实现 的 功能 与 使 用 命令 参数 -xx:BindTocPUs 相同 ， 可 以 控制 CPU 亲 和 性 。 更 
多 内 容 请 参见 第 5 章 。 

其 他 例如 暂停 时 间 、 堆 大 小 和 年 轻 代 大 小 等 内 容 ， 也 可 以 进行 调整 。 

MemorySystem ms = JVMFactory.getJVM() .getMemorySystem(); 

ms.suggestHeapSize(1024*1024*1024); 


ms.getGarbageCollector().setPauseTimeTarget (30); 
ms.getGarbageCollector().setNurserySize(256*1024*1024) ; 


某 些 JMAPI 中 的 特性 需要 用 户 做 一 些 特别 设置 。 有 些 特殊 需求 ， 例 如 在 JVM 内 存 不 足 时 ， 
不 要 抛 出 OutOfMemoryError 错误 ， 而 是 强制 终止 JRockit 进程 的 运行 。 


ms.setExitOnOutOfMemory (true); 


此 外 ， 还 可 以 使 用 JMAPI 做 一 些 简 单 的 方法 分 析 。 在 下 面 的 示例 中 ， 启 用 了 对 java.io. 
StringWriter#append (CharSequence) 的 方法 分 析 。 在 每 次 调用 该 方法 时 ， 都 会 打印 出 方法 
的 平均 执行 时 间 。 


import java.io.StringWriter; 
import java.lang.reflect.Method; 


= 














import com.bea.jvm.JVMFactory; 
import com.bea.jvm.MethodProfileEntry; 
import com.bea.jvm.ProfilingSystem; 


public class MethodProfilerExample { 
public static void main(String[] args) throws Exception { 
String longString = generateLongString(); 
ProfilingSystem profiler = JVMFactory.getJVM() 





262 第 12% JRockit Management API 





.getProfilingSystem(); 
Method appendMethod = StringWriter.class.getMethod ( 
"append", CharSequence.class) ; 
MethodProfileEntry mpe = profiler 
.-newMethodProfileEntry (appendMethod) ; 
mpe.setInvocationCountEnabled (true); 
mpe.setTimingEnabled (true); 


String total = doAppends(10000, longString) ; 
long invocationCount = mpe.getInvocations(); 
long invocationTime = mpe.getTiming(); 
System.out.printin("Did " + invocationCount 
+ " invocations"); 
System.out.printlin("Average invocation time was " 
+ (invocationTime * 1000.0d) 
/ invocationCount + " microseconds"); 
System.out.printin("Total string length " 
+ total.length()); 





private static String doAppends(int count, String longString) { 
StringWriter writer = new StringWriter(); 
for (int i = 0; i < count; i++) { 
writer.append(longString); 
} 


return writer.toString(); 


private static String generateLongString() { 
StringWriter sw = new StringWriter(1000); 
for (int ae 0% 2 = 1000; dee) -f 
// 构造 一 个 包含 了 字母 A 一 2 的 字符 串 
sw.append((char) (i % 26 + 65)); 
} 


return sw.toString(); 


} 


上 面 的 示例 比较 简单 。 正 常情 况 下 ， 分 析 功 能 会 启用 ， 因 此 MethodProfileEntry 中 的 计 
数 器 和 计时 信息 在 执行 分 析 之 前 就 已 经 保存 下 来 了 ， 在 分 析 结 束 后 也 可 以 正常 提取 出 来 。 

回忆 一 下 第 7 章 和 第 11 章 的 内 容 ， 其 中 介绍 的 诊断 命令 都 可 以 通过 JMAPI 实 现 ， 而 且 还 可 
以 通过 DiagnosticCommand 子 系 统 访问 。 在 下 面 的 示例 中 , 会 模拟 print_object_summary 
命令 的 实现 ， 在 控制 台中 打印 出 对 象 汇 总 信息 的 直方 图 。 


import com.bea.jvm.DiagnosticCommand; 
import com.bea.jvm.JVMFactory; 


















































public class ObjectSummary { 
public static void main(String[] args) 
throws InterruptedException { 
DiagnosticCommand dc = JVMFactory.getJVM() 
.getDiagnosticCommand() ; 
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String output = dc.execute("print_object_summary") ; 
System.out.printin(output) ; 
} 
} 


最 后 ，JMAPI 可 以 实现 类 的 预 处 理 和 重 定义 。 下 面 的 示例 通过 调用 trans formByteCode 
展示 了 如 何在 载 人 类 的 时 候 重 定义 类 的 字 节 码 。 


ClassLibrary cl = JVMFactory.getJVM().getClassLibrary (); 
cl.setClassPreProcessor (new ClassPreProcessor() { 
@Override 
public byte[] preProcess(ClassLoader cl, 
String className, 
byte[] arg) { 
System.out.println("Pre-processing class " + className); 
return transformByteCode (arg); 
} 
RE 


任意 时 间 ， 只 能 有 一 个 活动 的 预 处 理 需 。 通 过 redefineclass 方法 , 还 可 以 重 定义 已 经 载 
入 过 的 类 。 












































JMAPI 的 用 处 还 有 很 多 ， 篇 幅 所 限 ， 这 里 就 不 再 介绍 那些 废弃 的 或 已 经 不 
> 再 支持 的 特性 。 更 多 有 关 JMAPI 的 内 容 ， 请 参见 Oracle 官方 文档 。 


12.2 JMXMAPI 

















JRockit 中 的 另 一 种 Management API 就 是 JMXMAPI, 它 可 看 作 是 基于 JMX 的 IMAPI, 两 者 
虽然 不 是 一 一 对 应 ， 但 总 体 上 差不多 。 目 前 ，JMXMAPI 还 不 是 官方 支持 的 ， 可 能 会 在 将 来 的 版 
本 中 有 变动 。 

在 JRockit 的 每 个 发 行 版 中 ，JMXMAPI 中 MBean 的 域名 都 会 发 生变 化 。 在 R28 版 本 中 , 由 
于 Oracle 收购 BEA， 它 又 变 了 。 估 计 最 近 一 段 时 间 Oracle 不 太 可 能 被 收购 ， 所 以 期 望 这 次 域名 
能 保持 较 长 一 段 时 间 。 起 初 ，JMXMAPI 的 MBean 是 与 java.lang.management 域 中 的 MBean ( 参 
见 第 7 章 的 内 容 ) 放 在 一 起 的 ( R26.x 版 本 ), 后 来 把 它 放 到 了 bea.jrockitmanagement 域 下 ， 最 后 
又 把 它 移 到 了 oracle jrockitmanagement 域 下 。 若 想 以 版 本 无 关 的 方式 访问 JMX， 可 以 使 用 第 7 章 
中 介绍 的 RJMX 代理 层 来 实现 。 

若 想 访问 JMXMAPI， 就 必须 要 先 载 人 JRockitconsoleMBean， 具 体 来 说 ， 可 以 通过 
MBeanServerConnect ion 来 编程 实现 。 

TE R27.x 版 本 中 是 这 样 : 


someMBeanServerConnection.createMBean 
("bea.jrockit.management.JRockitConsole", null); 


在 R28.x 版 本 中 ， 则 是 这 样 : 
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someMBeanServerConnection.createMBean 


若是 使 有 


("oracle.jrockit.management.JRockitConsole", 


H Management Console 的 代理 层 ， 这 一 切 就 可 以 自动 完成 了 。 























null); 





各 个 MBean 是 按照 功能 来 分 组 的 。 在 R28 版 本 中 ， 还 可 以 自动 创建 JER 所 需要 的 MBean。 
在 下 表 中 ， 介 绍 了 可 用 的 MBean. 


JMXMAPI MBeans 






























































MBean 名 称 说 BA 
Compilation 有 关 JIT 编译 器 的 信息 
DiagnosticCommand 访问 JVM 内 部 诊断 命令 ， 参 见 第 11 章 相关 内 容 
GarbageCollector 有 关 垃 圾 回收 器 的 相关 信息 ， 可 以 对 垃圾 回收 器 进行 调整 
JRockitConsole Management Console 的 相关 功能 ， 例 如 转 储 堆 ， 创 建 该 MBean 时 会 实例 化 并 注册 相关 的 API 
Log 控制 TRockit 日 志 模 块 
Memleak 控制 Memleak 服务 器 
Memory 访问 物理 内 存 
PerfCounters 这 是 一 个 动态 生成 的 MBean， 可 以 列 出 所 有 的 内 部 性 能 计数 器 
Profiler 控制 方法 分 析 器 
Runtime 可 以 获取 CPU 信息 ，CPU 负载 ， 以 及 控制 CPU 亲 和 性 
Threading 获取 线程 相关 信息 。 目 前 只 包含 MBean 操作 ， 还 没有 属性 可 用 








在 R28 版 本 中 ,还 可 以 通过 基于 JMX 的 API 来 启动 和 控制 JR。 该 MBean 在 com.oracle.jrockit 


域 下 ， 


12.2 


大 部 分 IMXMAPI 都 会 暴露 出 MBean, UEM 
例外 ， 它 是 动态 生成 的 。JRockit 在 内 部 会 使 用 一 系列 必 
JRockit 内 部 性 能 计数 需 都 对 应 了 PerfCoun 


E 





入 口 点 在 名 为 FlightRecorder 的 MBean 中 。 它 并 不 属 


.1 JRockit 内 部 性 能 计数 器 








F JIMXMAPI. 























态 接口 , 但 PerfCountersMBean 是 个 
能 计数 器 来 完成 分 析 和 诊断 操作 。 每 个 
tersMBean 中 的 一 个 属性 。 


由 于 JMXMAPI 不 受 官方 支持 ， 连 带 着 动态 生成 的 PerfCountersMBean 
也 得 不 到 支持 ， 而 且 JRockity 内 部 的 计数 器 之 间 还 有 一 些 区 别 ，jrockit.* 包 下 的 
计数 器 比 oracle.* 包 下 的 计数 器 更 不 受 待 见 ， 支 持 更 少 。 


下 表 介 绍 了 在 4.0/R28.x 版 本 (在 写作 本 书 时 ,共有 139 种 计数 需 ) 中 最 重要 的 几 种 计数 需 。 




















TE a: 
java.cls.loadedClasses 启动 JVM 之 后 ， 共 载 人 了 多 少 类 
java.cls.unloadedClasses 启动 JVM Ži, ŁA TZN% 
java.property.java.class.path JVM 的 CLASSPATH 路 径 
java.property.java.endorsed.dirs AF endorsed 目录 的 说 明 ， 请 参见 oracle 官网 说 明 
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计 数 器 





.property.java.ext.dirs 








.property .java.home 

.property .java.library .path 

.property .java.vm.version 

.rt.vmArgs 

.threads . daemon 

.threads.live 

.threads.livePeak 

.threads .nonDaemon 

.threads.started 

kit.gc.latest.heapSize 
kit.gc.latest.nurserySize 
kit.gc.latest.oc.compaction.time 
kit.gc.latest.oc.heapUsedAfter 
kit.gc.latest.oc.heapUsedBefore 
kit.gc.latest.oc.number 
kit.gc.latest.oc.sumOfPauses 
kit.gc.latest.oc.time 
kit.gc.latest.yc.sumOfPauses 
kit.gc.latest.yc.time 
kit.gc.max.oc.individualPause 
kit.gc.max.yc.individualPause 
kit.gc.total.oc.compaction.externalAborted 
kit.gc.total.oc.compaction. internalAborted 
kit.gc.total.oc.compaction. internalSkipped 
kit.gc.total.oc.compaction.time 
kit.gc.total.oc.ompaction.externalSkipped 
kit.gc.total.oc.pauseTime 
kit.gc.total.oc.time 





















































( 28 ) 

说 明 
扩展 目录 中 的 jar 包 会 被 自动 添加 到 CLASSPATH 中 ， 人 参见 
JavaDoc 中 对 java .ext .dirs 的 说 明 
JDK 或 JRE 的 安装 路 径 
用 户 库 的 路 径 
JRockit 版 本 号 
VM 参数 
守护 线程 数 
运行 中 的 线程 的 数目 


E 


JVM 启动 后 ， 同 时 运行 的 线程 数目 的 峰值 


运 


JRockit 启动 后 ， 
当前 堆 大 小 ， 单 位 为 字 节 











i 


的 、 非 守护 线程 的 数目 
启动 的 线程 的 总 数目 































































































































































































































































































当前 年 轻 代 大 小 ， 单 位 为 字 节 

上 一 次 执行 内 存 整 理 所 花 费 的 时 间 ， 单 位 为 系统 满 答 数 
(tick )， 如 果 想 跳 过 内 存 整 理 操作 ， 可 将 之 置 为 0 

上 一 次 老年 代 垃圾 回收 结束 之 后 ， 堆 中 已 使 用 的 内 存 总 量 ， 
单位 为 字 节 

上 一 次 老年 代 垃圾 回收 开始 之 前 ， 堆 中 已 使 用 的 内 存 总 量 ， 
单位 为 字 节 

到 目前 为 止 ， 所 执行 过 的 老年 代 垃圾 回收 的 次 数 

了 上 一 次 老年 代 垃圾 回收 中 应 用 程序 的 暂停 时 间 ， 单 位 为 系统 
滴答 数 

上 一 次 老年 代 垃圾 回收 的 持续 时 间 ， 单 位 为 系统 滴答 数 

了 上 一 次 年 轻 代 垃圾 回收 中 应 用 程序 的 暂停 时 间 ， 单 位 为 系统 
滴答 数 

:一 次 年 轻 代 垃圾 回收 的 持续 时 间 ， 单 位 为 系统 滴答 数 

到 目前 为 止 ， 持 续 时 间 最 长 的 老年 代 垃圾 回收 的 持续 时 间 ， 
单位 为 系统 滴答 数 

到 目前 为 止 ， 持 续 时 间 最 长 的 年 轻 代 垃圾 回收 的 持续 时 间 ， 
单位 为 系统 滴答 数 

到 目前 为 止 ， 被 终止 的 外 部 整理 的 次 数 

到 目前 为 止 ， 被 终止 的 内 部 整理 的 次 数 

到 目前 为 止 ， 被 跳 过 的 内 部 整理 的 次 数 

到 目前 为 止 ， 执 行内 存 整理 所 花费 的 总 时 间 ， 单 位 为 系统 消 
答 数 

到 目前 为 止 ， 被 跳 过 的 外 部 整理 的 次 数 

到 目前 为 止 ， 所 有 老年 代 垃圾 回收 导 至 应 用 程序 暂停 的 总 时 
间 ， 单 位 为 系统 消 答 数 

到 目前 为 止 ， 花 费 在 老年 代 垃圾 回收 的 总 时 间 ， 单 位 为 系统 


























滴答 数 
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( 续 ) 
计 数 器 说 明 
jrockit.gc.total.pageFaults 到 目前 为 止 ， 在 垃圾 回收 过 程 中 所 遇 到 的 页 错误 (page fault ) 


jrockit.gc. 


jrockit.gc. 


jrockit.gc. 





jrockit.gc. 


oracle.ci. 
oracle.ci. 
oracle.ci. 
oracle.ci. 


oracle.rt. 


这 些 计数 器 都 非常 有 月 


total.yc.pauseTime 
































a 


到 目前 为 止 ， 所 有 年 轻 代 垃 圾 
间 ， 单 位 为 系统 滴答 数 


导致 应 用 程序 暂停 的 总 时 













































































total.yc.promotedobjects 到 目前 为 止 ， 从 年 轻 代 提升 到 老年 代 的 对 象 的 总 数 
total.yc.promotedsize 到 目前 为 止 ， 从 年 轻 代 提 升 到 老年 代 的 对 象 的 总 字 节 数 
total.yc.time 到 目前 为 止 ， 花 费 在 年 轻 代 垃 圾 回收 的 总 时 间 ， 单 位 为 系统 
滴答 数 

jit .count 到 目前 为 止 ， 经 过 JIT 编译 的 方法 总 数 

jit.timeTotal 到 目前 为 止 , 花费 在 JIT 编译 上 的 总 时 间 , 单位 为 系统 滴答 数 

opt .count 到 目前 为 止 ， 有 多 少 方法 被 优化 过 

opt .timeTotal 到 目前 为 止 ， 花 费 在 优化 上 的 总 时 间 ， 单 位 为 系统 滴答 数 


counterFrequency 





用 于 将 系统 滴答 数 转 换 为 以 秒 为 单位 的 时 间 



































日 , 需要 注意 的 是 , 不 少 计时 器 是 以 系统 滴答 数 为 单位 的 , 使 用 时 , 需要 


先 将 之 转换 为 以 秒 为 单位 (将 滴答 数 除 以 计数 器 oracle .rt.counterFrequency 的 值 即 可 )。 








在 MBean 浏览 器 (MBean browser) 中 ， 编 辑 表 设 置 ， 显 示 出 Description 字段 内 容 ， 以 便 
查询 哪些 计数 器 是 以 系统 滴答 数 为 单位 的 。 
在 Description 字段 末尾 会 列 出 计时 器 的 单位 。 











12.2.2 ”使 用 JMXMAPI 构建 可 远程 操作 的 JRCMD 


JMXMAPI 可 以 通过 标准 JMX 机 制 来 访问 〈 参 见 第 7 章 的 相关 内 容 )， 因 此 ， 可 以 很 容易 地 
通过 平台 MBean 服务 器 和 标准 远程 JMX 代理 来 访问 API。 正 如 第 11 章 中 介绍 的 ，JRCMD 只 能 
连接 到 本 地 服务 器 上 的 JVM， 而 且 要 求 IRCMD 和 JVM 的 启动 用 户 是 同一 人 。 相 比 之 下 ,使 用 
JMXMAPI 就 可 以 克服 这 些 限制 ， 实 现 远 程 访问 。 


import 
import 
import 
import 
import 
import 
import 
import 
import 
import 
import 
import 
import 











java.lang.management .ManagementFactory; 
java.net .MalformedURLException; 
java.util.HashMap; 


java.util.Itera 
java.util.Map; 


javax.management 
javax.management 
javax.management 
javax.management 
javax.management 
javax.management 
javax.management 
javax.management 





COL; 


.Attribute; 

. InstanceNot FoundException; 
.MBeanAttributelInfo; 
.MBeanServerConnection; 
.ObjectName ; 
.remote.JMXConnector; 
.remote.JMXConnectorFactory; 
.remote.JMXServiceURL; 
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/** 

* Simple code example on how to execute 

* ctrl-break handlers remotely. 

* 

* Usage: 

* RemoteJRCMD -host -port -user -pass -command [] 

* 

* All arguments are optional. If no command is 

* specified, all performance counters and their 

* current values are listed. 

* 

* @author Marcus Hirt 

ae 

public final class RemoteJRCMD { 

private final static String KEY_CREDENTIALS = 
"jmx.remote.credentials"; 

private final static String JROCKIT_PERFCOUNTER_MBEAN_ NAME = 
"oracle.jrockit .management:type=PerfCounters"; 

private final static String JROCKIT_CONSOLE_MBEAN_NAME = 
"oracle. jrockit .management:type=JRockitConsole"; 

private final static String[] SIGNATURE = 
new String[] {"java.lang.String"}; 

private final static String DIAGNOSTIC_COMMAND_MBEAN_NAME = 
"oracle. jrockit.management:type=DiagnosticCommand"; 


























public static void main(String[] args) 
throws Exception { 
HashMap<String, String> commandMap = 
parseArguments (args) ; 


execut eCommand ( 
commandMap.get ("-host") 
Integer.parselInt (commandMap.get ("-port")), 
commandMap.get("-user"), 
commandMap.get ("-password") 
commandMap.get ("-command") ) ; 


} 
private static HashMap<String, String> parseArguments ( 
String[] args) { 
HashMap<String, String> commandMap = 

new HashMap<String, String>(); 








commandMap.put("-host", "localhost"); 
commandMap.put("-port", "7091"); 
for (int i = 0; i < args.length; i++) { 
if (args[i].startsWith("-")) { 
StringBuilder buf = new StringBuilder (); 
int j =i +1; 
while (j < args.length && !args[j].startsWith("-")) { 
buf.append(" "); 
buf.append(args[j++]); 
} 
commandMap.put(args[i], buf.toString().trim()); 
oa foe Ty 
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return commandMap; 


@SuppressWarnings ("unchecked") 
public static void executeCommand ( 
String host, int port, String user, 
String password, String command) 
throws Exception { 
MBeanServerConnection server = null; 
JMXConnector jmxc = null; 
Map<String, Object> map = null; 
if (user != null || password != null) { 
map = new HashMap<String, Object>(); 
final String[] credentials = new String[2]; 
credentials[0] = user; 
credentials[1] = password; 
map.put (KEY_CREDENTIALS, credentials); 
} 
// 使 用 与 Sun 公司 相同 的 约定 
// "localhost:0" 表 示 "VM, monitor thyself!" 


if (host.equals ("localhost") && port == 0) { 
server = ManagementFactory.getPlat formMBeanServer () ; 
} else { 


jmxc = JMXConnectorFactory.newJMXConnector ( 
createConnectionURL (host, port), map); 
jmxc.connect (); 


server = jmxc.getMBeanServerConnection(); 
} 
System.out.println("Connected to " + host+ ":" + port); 
try { 


server.getMBeanInfo(new ObjectName ( 
JROCKIT_CONSOLE_MBEAN_NAME) ) ; 
} catch (InstanceNotFoundException el) { 
server .createMBean ( 
"oracle.jrockit.management.JRockitConsole", null); 





if (command == null) { 
ObjectName perfCounterObjectName = new ObjectName ( 
JROCKIT_PERFCOUNTER_MBEAN_NAME) ; 
System.out.printlin("Listing all counters..."); 
MBeanAttributeInfo[] attributes = server.getMBeanInfo( 
perfCounterObjectName) .getAttributes(); 
System.out.printin("Counter\tValue\n=======\t===="); 


String[] attributeNames = new String[attributes.length]; 

for (int i = 0; i < attributes.length; i++) { 
attributeNames[i] = attributes[i].getName() ; 

} 

Iterator valueIter = server.getAttributes ( 
perfCounterObjectName, 
attributeNames) .iterator(); 
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while (valueIter.hasNext()) { 
Attribute attr = (Attribute) valuelIter.next(); 
System.out.println(attr.getName() + "\t=\t" 
+ attr.getValue()); 
} 
} else { 
System.out.printlin("Invoking the ctrl-break command '" 
+ command + "'..."); 
ObjectName consoleObjectName 
DIAGNOSTIC_COMMAND_MBEAN_NAME 
Object[] params = new Object [ 
params[0] = command; 
System.out.printin("The CtrlBreakCommand returned: \n" 
+ server.invoke(consoleObjectName, 
"execute", params, 
SIGNATURE) ); 


new ObjectName ( 





3 
Ll 3 


i 


if (jmxc != null) { 
jmxc.close(); 


} 


private static JMXServiceURL createConnectionURL ( 
String host, int port) 
throws MalformedURLException { 
return new JMXServiceURL("rmi", "", 0, 
"/jndi/rmi://" + host + ":" 
+ port + "/jmxrmi"); 





} 
使 用 方式 如 下 所 示 : 


java RemoteJRCMD -command <command string> -host <host> 
-port <port> 


其 中 : 

O <command string> 是 IRCMD 中 的 调试 命令 ,例如 start_flightrecording name= 

MyRecording duration=30s; 

口 <host> 是 目标 JRockit JVM 所 在 的 主机 地 址 ， 例 如 localhost; 

口 <bort> 是 目标 JRockit JVM 中 JMX 代理 (RMIregistry ) 所 监听 的 端口 号 。 更 多 详细 内 容 ， 
请 参见 第 6 章 相关 内 容 。 默 认 情 况 下 ， 端 口号 是 7091。 

下 面 的 示例 会 列 出 所 有 性 能 计数 器 ， 主 机 是 localhost， 使 用 的 端口 是 7091: 


java RemoteJRCMD 


下 面 的 示例 会 列 出 主机 bisty， 端 口 4711 中 JRockit JVM 所 支持 的 所 有 诊断 命令 : 












































java RemoteJRCMD -command help -host bitsy -port 4711 


270 第 12% JRockit Management API 











下 面 的 示例 会 在 目标 SVM 中 开启 一 个 为 期 30 秒 的 记录 任务 , 并 在 记录 结束 后 将 记录 内 容 写 
人 到 指定 文件 中 : 
java RemoteJRCMD -command start_flightrecording 


name=myrecording filename=c:\tmp\myrecording.jfr 
duration=30s 


12.3 “小结 


在 本 章 中 ， 介 绍 了 JRockit 内 部 的 两 种 Management API， 它 们 都 可 以 访问 JRockit 的 内 部 功 
E (例如 访问 性 能 指标 数据 )， 也 可 以 以 编程 的 方式 操作 JRockit JVM 实例 。 

在 R28 版 本 之 前 ，JMAPI 是 一 个 本 地 的 纯 Java API， 受 JRockit 各 版 本 支持 ， 而 到 了 R28 版 
本 中 ， 就 只 支持 部 分 JMAPI 了， 而 且 前 途 未 卜 。 

JMXMAPI 本 身 不 受 正式 支持 ， 不 过 由 于 它 是 基于 JMX 的 ， 所 以 可 以 通过 平台 MBean 服务 
需 实 现 远程 访问 。 

虽然 JRockit Management API 还 不 受 正式 文 持 (部 分 文 持 )， 但 在 某 些 场景 下 确实 非常 有 用 ， 
例如 可 以 实现 远程 访问 有 下 CMD 。 










































































JRockit Virtual Edition 











近 些 年 ， 虚 拟 化 ( virtualization )， 即 在 模拟 硬件 上 运行 软件 ， 可 谓 是 风头 正 劲 。 通 过 虚拟 化 
可 以 最 大 化 硬件 资源 利用 率 , 同时 简化 资源 管理 。 不 过 , 作为 应 用 程序 和 实际 硬件 中 间 的 抽象 层 ， 
虚拟 化 也 会 带 来 额外 的 性 能 损耗 。 

本 章 将 介绍 JRockit Virtual Edtion ( 简称 JRockit VE ) 及 其 相关 技术 。 

JRockit VE 使 用 户 可 以 在 一 个 没有 操作 系统 的 虚拟 环境 中 运行 Java 应 用 程序 , 同时 免 去 了 虚 
拟 化 所 带 来 的 大 量 性 能 损耗 。JRockit VE 是 一 款 独立 的 产品 , 包含 了 运行 Java 应 用 程序 所 需要 的 
最 小 环境 ， 即 一 个 轻 量 级 的 类 操作 系统 内 核 和 一 个 JRockit JRE. 

JRockit VE 可 以 运行 任何 Java 应 用 程序 ， 不 过 最 初 可 能 更 多 的 是 作为 WLS on JRockit VE 
( WebLogic server on JRockit virtual edtion ) 产品 的 一 部 分 来 使 用 。WLS on JRockit VE 是 以 虚拟 机 
镜像 (virtrual machine image ) 格式 预先 打包 好 的 WebLogic Server 安装 文件 。 虚 拟 机 镜像 是 一 个 
二 进 制 镜像 ， 其 中 包含 了 虚拟 机 配置 、 二 进 制 软件 和 文件 系统 。 将 虚拟 机 镜像 部 署 在 专门 的 虚拟 
环境 中 ， 例 如 Oracle VM Server， 就 可 以 运行 相应 的 应 用 程序 了 。 

本 章 将 对 JRockit VE 相关 技术 进行 介绍 , 着 重 讲解 虚拟 化 JRockit VE 背后 的 相关 技术 , 对 于 
构建 于 JRockit VE 之 上 的 软件 栈 ， 则 不 再 歼 述 。 

































































本 章 旨 在 介绍 新 近 的 技术 产品 , 因此 细节 、 名 称 、 概 念 和 具体 实现 可 能 会 与 

过 人 之 前 章节 中 的 技术 有 所 区 别 。 本 章 中 还 有 一 些 前 上 脆性 的 、 还 未 实现 的 技术 介绍 。 

OO 然而， 万 变 不 离 其 宗 ， 不 论 如 何 ， 核 心 概念 是 相同 的 。 相 关 产 品 的 最 新 信息 可 以 
在 官网 的 在 线 文档 上 查看 。 


本 章 主 要 包含 以 下 内 容 。 

口 虚拟 化 的 基本 概念 以 及 几 种 不 同 的 虚拟 化 实现 。 

口 虚拟 机 管理 程序 的 概念 、 类 型 以 及 当今 市 场 上 最 重要 的 虚拟 机 管理 程序 。 

O 软件 栈 虚拟 化 的 优 劣 ， 以 及 如 何 充分 发 挥 软件 栈 的 优势 。 

O Java 虚拟 化 的 相关 问题 ， 以 及 JRockit VE 简化 虚拟 化 处 理 并 提升 性 能 的 方法 。 
口 虚拟 机 镜像 的 概念 。 

口 展望 虚拟 化 的 未 来 。 
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13.1 虚拟 化 简介 


近 些 年 , 虚拟 化 逐渐 成 为 了 热点 话题 , 但 将 硬件 资源 抽象 为 一 个 虚拟 层 本 身 并 不 是 什么 新 鲜 
事物 。 现 在 所 有 操作 系统 中 标 配 的 虚拟 内 存 (virtual memory ) 就 是 一 种 虚拟 化 ， 单 一 物理 硬盘 
划分 为 多 个 分 区 也 是 一 种 虚拟 化 。 相 比 之 下 , 最近 热 炒 的 虚拟 化 更 多 的 是 指 虚 拟 整 个 物理 机 ,不 
过 这 也 不 是 什么 新 玩意 ， 早 在 20 世纪 60 年 代 IBM 就 已 经 开始 做 相关 的 产品 了 ,但 直到 最 近 ， 
才 真 正 充分 发 挥 了 虚拟 化 的 威力 ， 它 既 增加 了 资源 利用 率 ， 又 提升 了 整体 的 管理 能 

本 书 中 ， 虚 拟 化 是 在 以 软件 模拟 的 虚拟 硬件 (virtual hardware ) 上 运行 平台 ( 如 操作 系统 ) 
或 独立 的 应 用 程序 。 虚 拟 硬件 通常 与 实际 的 物理 硬件 类 似 。 部 署 在 虚拟 系统 上 的 应 用 程序 套件 通 
常 称 为 客户 应 用 程序 ( guest )， 而 可 以 使 多 个 客户 应 用 程序 ( 如 操作 系统 ) 在 同一 个 系统 上 运行 
的 软件 称 为 虚拟 机 管理 程序 (hypervisor )。 虚 拟 机 管理 程序 可 以 为 客户 应 用 程序 提供 设备 驱动 程 
Fe, 使 其 可 以 在 虚拟 环境 中 运行 ， 进 而 提升 客户 应 用 程序 的 运行 性 能 。 

































































不 同类 型 的 虚拟 化 资源 的 具体 实现 有 所 不 同 。 例如 ,看 起 来 像 是 物理 硬盘 的 
资源 , 实际 上 只 是 某 处 服务 器 上 的 一 个 或 一 组 文件 ; 看 起 来 像 是 有 4 个 物理 CPU 
可 用 ， 实 际 上 可 能 只 是 几 个 CPU 分 时 共享 而 已 ; 看 起 来 有 1 GB 物理 内 存 可 用 ， 
> 实际 上 可 能 只 是 大 容量 物理 内 存 的 一 部 分 。 某 些 虚 拟 化 管理 程序 其 至 允许 客户 应 
用 程序 分 配 的 内 存 容量 超过 其 分 配 限额 (overcommit )。 不 过 对 于 客户 应 用 程序 
来 说 这 无 所 谓 ， 它 仍旧 只 能 看 到 其 分 配 的 内 存 ( 当然 也 有 例外 )。 





虚拟 化 愈 炒 愈 热 , 主要 原因 在 于 虚拟 化 可 以 更 高 效 地 利用 已 有 的 硬件 资源 。 如 果 物 理 机 上 的 
CPU 处 于 空闲 状态 〈 例 如 可 能 是 在 等 待 WO )， 那 么 就 是 浪费 。 而 对 于 那些 运行 了 多 个 客户 应 用 
程序 的 虚拟 环境 来 说 ， 若 某 个 客户 应 用 程序 的 CPU 处 于 空闲 状态 ， 则 可 以 将 CPU 资源 交 给 其 他 
客户 应 用 程序 使 用 。 当 然 ， 若是 多 个 客户 应 用 程序 比如 操作 系统 ) 都 特别 “ 忙 ”"， 则 反而 会 因 
频繁 的 上 下 文 切换 而 降低 执行 性 能 。 不 过 虚拟 化 的 优势 实在 诱 人 , 它 大 大 提升 了 硬件 资源 的 利用 
率 。 在 环境 问题 日 益 严 重 的 今天 ， 合 理 利用 资源 才能 更 好 地 利用 能 源 。 

虚拟 化 可 以 划分 为 多 种 类 型 , 划分 的 主要 依据 是 其 背后 所 代表 的 平台 层级 。 这 其 中 涉及 一 些 
常 被 混淆 的 技术 概念 ,我 们 先 介绍 一 些 常 用 概念 及 其 在 本 书 中 的 用 法 。 虚 拟 化 本 身 很 复杂 ， 接 下 
来 的 内 容 中 会 对 其 做 简单 介绍 。 


13.1.1 全 虚拟 化 


全 虚拟 化 (fall virtualization ) 是 指 ， 虚 拟 机 管理 程序 模拟 出 当前 系统 平台 所 能 提供 的 所 有 关 
键 功能 ， 例 如 设备 交互 和 内 存 映射 等 。 这 样 ， 客 户 应 用 程序 就 可 以 不 经 修改 直接 部 署 上 线 。 

对 于 那些 硬件 不 能 直接 支持 虚拟 化 的 平台 来 说 , 可 以 捕获 客户 应 用 程序 执行 的 特权 指令 并 在 
沙 箱 环境 中 模拟 特权 指令 的 执行 。 
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全 虚拟 化 也 可 以 由 硬件 辅助 实现 , 例如 针对 特定 的 CPU，Interl VT 技术 和 AMD-V 技术 使 其 
可 以 同时 运行 在 多 个 操作 系统 上 。 人 硬件 支 持 的 虚拟 化 大 大 降低 了 虚拟 机 管理 程序 的 模拟 消耗 。 最 
it, 除了 CPU 之 外 ， 其 他 硬件 出 现 了 直接 支持 虚拟 化 的 趋势 ， 例 如 现在 某 些 网 卡 内 建 了 对 虚拟 
化 的 直接 支持 。 

有 了 硬件 的 直接 支持 后 ， 虚 拟 化 性 能 大 幅 提升 ， 全 虚拟 化 的 发 展 突飞猛进 。 


13.1.2 ” 半 虚 拟 化 


半 虚 拟 化 ( paravirtualization ) 是 指 客户 应 用 程序 在 运行 时 需要 知晓 其 运行 在 虚拟 环境 中 。 
典型 场景 是 ， 客 户 应 用 程序 在 执行 特权 操作 时 ， 需 要 通过 显 式 调用 虚拟 机 管理 程序 的 API 接口 
才能 完成 操作 ， 即 客户 应 用 程序 必须 要 与 底层 抽象 层 通 信 ， 因 而 需要 知道 它 自己 是 在 虚拟 环境 
中 运行 的 。 

半 虚 拟 化 牺牲 了 部 分 灵活 性 ， 因 为 在 将 客户 应 用 程序 ( 例如 操作 系统 ) 部 署 到 虚拟 环境 之 前 
需要 做 相应 的 修改 。 相 应 地 ， 由 于 半 虚 拟 化 舍弃 了 那些 不 必要 的 抽象 层 ,进而 提升 了 整个 虚拟 环 
境 的 运行 性 能 , 而 且 用 户 也 不 必 关 心底 层 虚 拟 机 管理 程序 的 具体 实现 。 例如 , 早期 的 Xen 是 一 个 
只 支持 半 虚 拟 化 的 虚拟 机 管理 程序 ,主要 功能 就 是 运行 那些 预先 打包 好 的 操作 系统 镜像 ,用 户 只 
需要 将 应 用 程序 部 署 在 这 些 打 包 好 的 操作 系统 镜像 上 即 可 。 

硬件 的 直接 支持 使 全 虚拟 化 大 踏步 前 进 ， 相 比 之 下 ， 半 虚拟 化 则 已 是 明日 黄花 。 


13.1.3 ”其 他 虚拟 化 术语 


虚拟 化 领域 还 有 很 多 专业 术语 ， 用 于 表述 不 同 的 含义 ,例如 部 分 虚拟 化 ( partial virtualization )。 
在 某 些 场景 下 , 半 虚 拟 化 和 部 分 虚拟 化 是 同一 个 意思 , 不过， 部 分 虚拟 化 还 可 以 表示 虚拟 硬件 的 
指定 部 分 。 例 如 , 在 Macintosh 计算 机 上 , 部 分 虚拟 化 还 用 于 描述 像 Rosetta 这 样 的 二 进 制 转换 工 
E. (使 在 PowerPC 上 编译 的 软件 可 以 运行 在 Intel 架构 上 )。 部 分 虚拟 化 并 不 强求 硬件 支持 。 操 作 
系统 中 的 虚拟 内 存 也 可 算 作 是 部 分 虚拟 化 的 一 种 。 

最 近 ， 操 作 系统 级 虚拟 化 (operating system level virtualization ) 颇 受 关注 ， 典 型 场景 就 是 将 
操作 系统 划分 为 可 以 同时 运行 的 多 个 实例 ， 看 起 来 像 是 真 的 有 多 个 操作 系统 一 样 。 广 为 人 知 的 
Solaris Containers 就 是 用 这 种 技术 实现 的 。 


13.1.4 ”虚拟 机 管理 程序 


虚拟 机 管理 程序 负责 创建 虚拟 环境 的 软件 层 ( 未 必 有 硬件 的 直接 支持 )， 为 客户 应 用 程序 提 
供 一 个 理想 的 物理 机 的 抽象 屋 ， 捕 获 客 户 应 用 程序 所 有 可 能 破坏 抽象 层 的 “和 危险 操作 ”， 如 设备 
交互 和 内 存 映 射 ， 将 其 转换 为 自身 实现 的 具有 相同 功能 的 安全 操作 。 

正如 虚拟 化 有 多 种 类 型 ， 虚 拟 机 管理 程序 也 有 多 种 类 型 ， 这 里 只 对 托管 型 虚拟 机 管理 程序 
(hosted hypervisor ) 和 本 地 型 虚拟 机 管理 程序 ( native hypervisor ) 做 相关 介绍 。 
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1. 托管 型 虚拟 机 管理 程序 

托管 型 虚拟 机 管理 程序 一 般 是 作为 操作 系统 的 一 个 标准 进程 来 运行 的 。 正如 前 面 提 过 的 , 虚 
拟 机 管理 程序 捕获 客户 应 用 程序 的 敏感 操作 ( 内 核 模式 )， 并 将 其 替换 为 自身 实现 的 安全 操作 。 
对 于 客户 应 用 程序 中 以 用 户 模 式 执行 的 操作 , 通常 可 以 作为 托管 型 虚拟 机 管理 程序 进程 的 一 部 分 
来 直接 执行 ， 当 然 ， 也 可 以 通过 模拟 或 IT 解释 的 方式 来 运行 安全 操作 。 
托管 型 虚拟 机 管理 程序 的 主要 优势 在 于 安装 和 使 用 非常 方便 , 它 本 身 就 是 操作 系统 中 的 一 个 
应 用 程序 而 已 。 通 常 来 说 ,托管 型 虚拟 机 管理 程序 还 不 足以 满足 服务 器 端 对 性 能 的 要 求 ,， 不 过 没 
关系 ， 这 本 身 就 不 是 托管 型 虚拟 机 管理 程序 的 主要 用 途 。 














































































































本 书 的 大 部 分 内 容 都 在 是 Macintosh 电脑 上 完成 的 ， 而 JRockit 目前 还 不 支 
持 该 平台 。 因 此 ,我 们 就 通过 托管 型 虚拟 机 管理 程序 VMware Fusion 在 Macintosh 
电脑 上 运行 了 一 个 Linux 系统 来 操作 JRockit。 


VMware Player 和 Oracle VirtualBox 就 是 简单 的 托管 型 虚拟 机 管理 程序 。 

2. 本 地 型 虚拟 机 管理 程序 

本 地 型 虚拟 机 管理 程序 无 须 操作 系统 的 支持 , 可 以 直接 安装 在 物理 硬件 上 。 硬件 驱动 由 虚拟 
机 管理 程序 提供 ， 具 体 来 说 可 以 是 独立 的 专用 虚拟 机 (如 Oracle 虚拟 机 中 基于 VM 或 Xen 的 解 
决 方案 ), 或 者 是 作为 虚拟 机 管理 程序 本 身 的 一 部 分 来 提供 ( 例如 VMware ESX )。 












































一 般 情况 下 ， 本 地 型 虚拟 机 管理 程序 的 执行 性 能 远 高 于 托管 型 虚拟 机 管理 程序 。 
Oracle VM 和 VMware ESX 就 是 本 地 型 虚拟 机 管理 程序 ， 虽然 其 实现 原理 不 尽 相 同 ,， 但 都 可 
以 直接 安装 在 物理 硬件 上 。 





3. 市 面 上 其 他 的 虚拟 机 管理 程序 

得 益 于 虚拟 化 市 场 的 快速 发 展 ， 现 在 有 多 款 成 熟 的 虚拟 机 管理 程序 可 供 选 择 。 

Xen 是 一 款 开源 的 虚拟 机 管理 程序 ， 最 初 由 剑桥 大 学 开发 ， 并 成 立 XenSource 公司 来 运营 该 
产品 。Xen 在 2007 年 被 Citrix 公司 收购 。 后 来 ，Citrix 公司 发 布 了 带 有 额外 的 API 和 管理 工具 的 
商业 版 本 ， 而 基于 开源 协议 的 Xen 本 身 仍 是 免费 的 。 

Xen 因 其 开源 属性 而 得 到 广泛 应 用 ， 并 且 已 经 发 展 为 本 地 型 虚拟 机 管理 程序 。Oracle VM 是 
Oracle 公司 出 品 的 基于 Linux 系统 的 操作 系统 ， 其 底层 实现 是 Xen 和 本 地 型 虚拟 机 管理 程序 。 

最 初 ，Xen 是 一 个 半 虚 拟 化 解决 方案 ， 也 就 是 说 ， 客 户 应 用 程序 需要 知晓 其 运行 在 虚拟 环境 
中 ， 才 能 与 虚拟 机 管理 程序 交互 。 例 如 ， 运 行 在 半 虚 拟 化 的 Xen 上 的 Linux 内 核 需要 针对 Xen 
专门 编译 一 下 才能 使 用 。 不 过 ，Xen 终究 还 是 顺从 了 漳 流 ， 逐 步 向 本 地 型 虚拟 机 管理 程序 转变 。 

VMware 公司 是 虚拟 化 领域 的 早期 参与 者 之 一 , 发 布 了 多 款 虚拟 化 产品 , 包括 本 地 型 和 托管 
型 ， 其 明星 产品 包括 VMware Workstation ( 在 Macintosh 上 的 VMware Fusion ), WMware ESX 和 
VMware ESXi 等 ， 这 些 都 是 商业 产品 。VMware Workstation 还 有 一 款 功能 略 有 缩水 的 免费 版 ， 名 
为 WMwarePlayer， 该 版 本 不 能 创建 和 配置 自 定义 的 虚拟 机 ， 只 能 运行 已 有 的 虚拟 机 客户 应 用 程 
序 。 此 外 ，WMware 还 有 一 款 托管 型 虚拟 化 平台 ， 名 为 VMware Server， 也 是 免费 的 。 
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微软 公司 自 研 的 针对 Windows Server 平台 的 Hyper-V 虚拟 化 框架 (Hyper-V virtualization 
framework ) 应 用 广泛 。 使 用 Hyper-V 需要 有 支持 虚拟 化 的 硬件 。 

KVM ( kernel-based vrtual machine ) 是 一 个 开源 的 虚拟 机 管理 程序 项 目 ， 以 GPL 协议 发 行 ， 
目前 由 RedHat 主推 。 

Parallel 公司 在 Macintosh , Windows 和 Linux 平台 上 均 开发 了 桌面 版 和 服务 器 版 的 虚拟 化 软件 。 

此 外 ， 值 得 一 提 的 是 VirtualBox， 这 是 一 个 独立 的 虚拟 化 包 ， 其 中 包含 了 自 有 的 虚拟 机 管理 
程序 , HAP CIM IRS AEA ASCE A. VirtualBox 最 初 是 德国 一 家 名 为 Innotek 的 公司 
研发 的 ， 后 被 Sun 公司 收购 ， 现 在 已 经 归属 于 Oracle 了 。 


13.1.5 ”虚拟 化 的 优势 


正如 前 面 提 到 的 , 虚拟 化 的 主要 优势 在 于 可 以 提升 资源 利用 率 。 多 个 客户 应 用 程序 可 以 在 同 
一 台 物 理 机 器 上 竞争 使 用 所 有 的 资源 ， 当 一 个 客户 应 用 程序 空闲 时 ， 另 一 个 可 能 正在 运行 , 因而 
可 以 减少 服务 咒 的 空闲 时 间 。 

虚拟 化 的 另 一 个 优势 就 是 “ 云 计算 ”应 用 。 虚 拟 化 之 后 的 客户 应 用 程序 可 能 需要 挂 起 、 迁 移 
到 其 他 物理 机 器 ,并 恢复 ,多 台 物 理 机 可 以 被 抽象 为 一 组 计算 资源 , 并 基于 这 组 计算 资源 来 部 署 
应 用 程序 。 通 常 来 说 ， 这 需要 通过 各 种 管理 框架 来 实现 资源 的 分 配 。 



































































































































此 外 ,党 被 忽略 却 非 常 重要 的 一 点 是 , 虚拟 化 更 有 利于 “古董 ”程序 ( legacy 
application ) 的 运行 。IT 部 门 常见 的 恒 梦 就 是 某 些 应 用 程序 是 在 古董 硬件 上 开发 
的 ,这些 硬 件 即 将 退役 , 而 这 些 应 用 程序 却 不 能 向 前 兼容 新 的 硬件 平台 。 在 将 应 
用 程序 迁移 到 新 硬件 平台 上 时 , 要 么 完全 重 写 一 遍 , 要 么 就 是 用 各 种 “大 招 ”( 例 
如 COBOL 转 Java ) 来 勉强 趟 过 这 潭 浑 水 。 这 时 ， 若 是 能 虚拟 一 份 十 董 硬件 就 可 

以 使 这 些 应 用 程序 继续 运行 了 ， 替 换 硬 件 的 压力 也 就 小 得 多 了 。 


13.1.6 ”虚拟 化 的 劣势 


虚拟 化 的 主要 劣势 在 于 , 虚拟 机 管理 程序 在 客户 应 用 程序 和 硬件 之 间 提 供 的 抽象 层 会 带 来 额 
外 的 性 能 损耗 。 虽 然 虚 拟 化 提升 了 硬件 资源 的 利用 率 ， 但 带 来 的 性 能 损耗 也 是 需要 注意 的 。 

以 Java 应 用 程序 为 例 ， 对 于 运行 在 本 地 的 标准 Java 应 用 程序 来 说 ，JVM 本 身 就 是 一 种 对 硬 
件 的 抽象 ， 而 运行 着 JVM 的 操作 系统 则 是 对 硬件 的 另 一 种 抽象 。 对 于 运行 在 虚拟 环境 中 的 Java 
应 用 程序 来 说 , 负责 创建 虚拟 环境 的 虚拟 机 管理 程序 则 是 在 操作 系统 上 在 应 用 程序 和 其 实际 运行 
的 本 地 代码 之 间 提 供 了 新 的 抽象 层 。 

要 将 每 一 个 抽象 层 尽量 做 得 薄 且 高 效 并 不 难 , 难 的 是 如 何 将 各 抽象 层 融 合 到 一 起 。 例如 , 通 
过 硬件 支持 来 实现 虚拟 机 管理 程序 可 以 降低 虚拟 化 的 性 能 损耗 , 但 为 了 虚拟 化 应 用 程序 却 仍 不 得 
不 虚拟 物理 硬件 ， 而 这 部 分 性 能 损耗 就 无 法 消除 了 。 
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13.2 Java 虚拟 化 




















接 下 来 讨论 一 下 在 生产 环境 中 通过 虚拟 环境 运行 Java 应 用 程序 服务 器 的 事情 。 下 面 的 示意 





























图 展示 了 从 应 用 程序 服务 器 到 物理 硬件 之 间 的 所 有 结构 。 在 Java 应 用 程序 和 物理 硬件 之 间 ， 包 





含 了 JVM、 操 作 系 统 ( 例如 Oracle Enterprise Linux ) 和 虚拟 机 管理 程序 ( 如 Oracle VM )。 








3 层 虚 拟 化 
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像 Oracle WebLogic 这 样 的 应 用 服务 需 就 是 通过 JVM 来 运行 的 。JVM 为 运行 在 其 上 的 Java 应 
用 程序 提供 了 针对 各 类 操作 系统 的 抽象 , 屏蔽 了 操作 系统 之 间 的 差异 , 实现 “一 次 编写 到 处 运行 ”。 
位 于 JVM 之 下 的 是 操作 系统 , JVM 必须 与 之 一 一 适 配 , 例如 ,在 类 Unix 系统 上 ,内 存 的 分 
页 机 制 与 Windows 系统 颇 为 不 同 ， 系 统 调 用 也 有 所 区 别 (mmap 与 VirtualAlloc )。 在 不 同 的 
操作 系统 上 , 创建 线程 的 操作 也 有 所 区 别 (POSIX 线程 与 Windows 线程 ),。 为 了 实现 一 次 编写 到 
处 运行 ，JVM 需要 应 用 具体 的 操作 系统 模块 来 操作 内 存 ， 所 以 ,操作 系统 就 充当 了 JVM 和 机 器 

















之 间 的 抽象 层 。 

















因此 , 通用 操作 系统 的 作用 就 是 对 人 硬件 进行 抽象 ， 以 便 简 化 应 用 程序 与 硬件 的 交互 。 让 应 用 
程序 的 开发 人 员 通 过 原子 汇编 指令 自行 实现 针对 特定 世 














而 操作 系统 就 是 为 完成 这 些 任务 而 生 的 ， 是 JVM 下 的 第 2 层 抽象 。 





片 的 同步 机 制 或 线程 实现 ， 是 不 现实 的 ， 


最 后 ,进入 到 虚拟 世界 中 ,虚拟 机 管理 程序 形成 了 第 3 层 抽象 ,各 个 客户 应 用 程序 均 通过 虚 





拟 机 管理 程序 来 访问 物理 硬件 。 











抽象 层 之 间 的 交互 也 会 带 来 一 些 性 能 损耗 , 特别 是 高 层 抽象 与 低层 抽象 交互 时 往往 会 涉及 一 
些 特 权 操 作 ， 例 如 获取 时 间 、 清 除 缓存 以 及 抢占 任务 等 。 





然而 , 如 果 虚 拟 操作 系统 的 唯 





























任务 是 运行 JVM, 而 JVM 的 唯一 任务 就 是 运行 Java 应 用 程 


序 的 话 ， 那 这 么 多 层 抽象 不 是 很 浪费 吗 ? 只 为 运行 一 个 Java 应 用 程序 的 话 ， 真 的 需要 一 个 像 


Windows 这 样 的 全 功能 操作 系统 吗 ? 





























FKE, Java 应 用 程序 (假设 是 纯 Java 代码 编写 的 应 用 程 




















序 ) 并 不 知道 它 运 行 在 什么 系统 上 ， 也 不 关心 这 些 。 如 果 Java 应 用 程序 不 涉及 GUI， 还 需要 显 
示 功 能 吗 ? 如果 所 有 的 访问 控制 都 由 应 用 程序 内 部 处 理 ， 那 还 需要 操作 系统 吗 ? 








13.2 Java 虚拟 化 277 





目前 , JVM 需要 提供 IDK 库 函 数 以 支持 线程 和 同步 ,实现 内 存 管 理 及 其 他 林林总总 的 任务 。 
因此 ， 不 太 严 谨 地 说 ，JVM 就 是 一 个 专用 的 虚拟 操作 系统 。 
或 许 让 JVM 直接 运行 在 虚拟 机 管理 程序 上 是 个 不 错 的 主意 。 











13.2.1 JRockit Virtual Edition 


如 果 能 在 保留 Java 虚拟 化 优势 的 情况 下 , 去 除 虚 拟 化 的 开销 , 那 肯定 是 好 处 多 多 。 如果 Java 
和 硬件 之 间 的 抽象 层 能 足够 小 , 则 不 仅 可 以 提升 性 能 , 还 能 简化 系统 , 增强 安全 性 。 对 此 , JRockit 
架构 师 提 出 的 解决 方案 是 JRockit VE ( JRockit virtual edition )。 








| 在 2005 年 的 时 候 ,我 们 写 了 个 链接 器 来 查找 JVM 不 使 用 操作 系统 会 丢失 哪 
S 些 生成 的 符号 ， 结 果 发 现 没 少 几 个 ， 而 这 就 成 了 JRockit VE 项 目的 雏形 。 

JRockit VE 包含 JRockit JRE( 纯 Java 服务, 例如 SSH 守护 进程 ), 以 及 一 个 迷你 操作 系统 ( 即 
所 谓 的 JRockit VE 内 核 ，JRockit VE kernel )， 通 过 该 迷你 操作 系统 ， 使 JVM 看 来 像 是 运行 在 虚 
拟 机 管理 程序 上 一 样 ， 并 为 VM 提供 所 需 的 操作 系统 功能 ， 当 然 ， 只 提供 了 必要 的 一 部 分 功能 。 

Any, JRockit VE 还 只 支持 x86 平台。 


























Hat, JRockit VE 的 商业 版 只 能 运行 在 Oracle VM 的 虚拟 机 管理 程序 上 (也 

就 是 运行 在 Xen 上 )， 将 来 或 许 会 支持 其 他 虚拟 机 管理 程序 。 
JRockit VE 的 设计 哲学 是 ，JRockit VE 内 核 的 运行 平台 是 硬件 ， 而 不 是 虚拟 
机 管理 程序 。 因 此 ，JRockit VE 内 核 中 包含 了 一 个 小 型 的 E1000 网 卡 驱 动 ， 可 以 
在 任何 x86 F&L, iit USB 启动 JRockit VE 来 运行 Java 应 用 程序 。 这 个 例子 
确实 很 酷 , 虽然 或 许 不 太 能 说 明 JRockit VE 对 云 计算 的 贡献 , 不 过 我 们 会 谈 到 的 。 


JRockit VE 中 还 提供 了 相关 工具 ( 即 Image Tool) 来 创建 和 操作 用 于 运行 在 虚拟 环境 中 的 Java 
应 用 程序 。 当 虚拟 化 一 个 JRockit VE 中 的 Java 应 用 程序 时 ,实际 上 指 的 是 操作 一 个 虚拟 机 镜像 。 


Java 应 用 程 
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JRockit VE 工具 












JVM 所 需 的 有 限 的 操作 系统 功能 
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上 图 展示 了 部 署 在 JRockit VE 上 的 Java 应 用 程序 的 软件 栈 。 部 署 时 , 像 SSH 这 类 的 服务 是 在 
Java 层 运 行 的 。JRockit JVM 位 于 JRockit VE AK EH, JRockit VE 为 JRockit JVM 提供 底层 支持 。 

接 下 来 ， 将 会 详细 介绍 JRockit VE 内 核 的 相关 功能 和 实现 细节 。 

JRockit VE 内 核 

JRockit VE 移 除 了 JVM 对 底层 操作 系统 的 依赖 ,使 Java 直接 运行 在 虚拟 机 管理 程序 上 。 目 前 ， 
Linux 版 本 的 JRockit JVM 可 以 直接 运行 在 下 ockit VE 内 核 上 。 不 过 ， 在 后 续 的 版 本 中 ， 可 能 会 
将 JRockit VE 内 核 整 合 为 完整 的 JVM 平台 ,这样 可 以 减少 软件 栈 中 抽象 层 的 数量 ， 简 化 具体 实 
现 。 之 所 以 现在 通过 JRockit VE 内 核 来 模拟 Linux API， 是 因为 实在 是 没 时 间 来 为 JRockit JVM 
开发 专用 的 平台 。 



























































虽说 现在 JRockitJVM 只 是 个 Linux 发 行 版 ， 不 过 却 不 会 对 性 能 产生 额外 的 

影响 ， 也 不 会 将 JRockit JVM 限制 在 Linux 上 。 通 过 操作 系统 层 ，JRockit VE 内 

> 核 可 以 为 Linux 版 本 的 JVM 提供 更 为 理想 的 执行 环境 ， 通 过 专用 的 JVM， 可 以 
进一步 提升 应 用 程序 的 整体 性 能 。 


从 概念 上 讲 ，JRockit VE 内 核 与 操作 系统 非常 相像 ， 但 真 作为 操作 系统 用 的 话 还 差 得 很 远 。 它 
虽然 包含 了 线程 实现 、 调 度 器 、 文 件 系统 、 内 存 分 配 等 模块 ， 但 和 真正 的 操作 系统 相 比 还 太 简 单 。 

JRockit VE 内 核 只 能 运行 一 个 进程 ， 即 JRockit JVM。 此 外 ， 由 于 JVM 是 一 个 沙 箱 ， 也 不 必 担 
心 恶意 的 Java 代码 会 对 系统 造成 危害 , 而 且 JVM 本 身 也 会 进行 相关 的 安全 审查 ( 例如 字 节 码 校 验 )。 

不 过 , 这 里 有 一 个 重要 限制 ， 即 JRockit VE 会 禁用 任何 本 地 代码 ， 因 为 确实 没 办 法 确认 本 地 
代码 的 行为 。 这 既是 功能 性 问题 ， 也 是 安全 性 问题 。 本 地 代码 中 可 能 会 包含 系统 调用 ， 可 能 是 平 
人 台 相 关 的 ， 而 且 本 地 代码 中 可 能 还 会 含有 恶意 代码 。 就 目前 的 Java 应 用 程序 来 看 ， 禁 用 本 地 代 
码 还 不 算是 太 大 的 问题 ， 因 此 JRockit VE 不 支持 JNI。 

JRockit VE 内 核 的 另 一 个 限制 就 是 ， 不 具备 常见 于 通用 操作 系统 的 高 级 分 页 机 制 。 因 为 
JRockit VE 只 会 运行 JRockit JVM 一 个 进程 ， 所 以 只 映射 一 个 虚拟 地 址 空间 就 够 了 。 

下 图 展示 了 JRockit VE 内 核 中 的 各 个 模块 ,包括 文件 系统 、 设 备 驱 动 ( 用 于 与 虚拟 机 管理 程 
序 通信 )、 块 缓存 、 自 包含 的 网 络 栈 、 内 存 管 理 和 线程 调度 器 等 。 
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就 暴露 出 的 API 来 说 ，JRockit VE 内 核 与 类 Unix 系统 非常 相似 。 正 如 前 文 提 到 的 ，Linux 版 
本 的 JRockit JVM 可 以 直接 运行 在 JRockit VE 内 核 上 ,不 过 这 只 说 明 JRockit VE 内 核实 现 了 通常 
操作 系统 的 部 分 功能 ， 并 不 意味 着 JRockit VE 内 核 真 的 兼容 了 Linux 系统 。JVM 所 使 用 的 API 
看 起 来 像 是 POSIX 系统 调用 ， 但 实际 上 不 是 ， 缺 少 了 POSIX 的 一 些 通用 功能 。 若 是 以 后 运行 
JRockit 时 需要 感知 到 JRockit VE 的 存在 ， 就 可 以 省 去 很 多 伪装 Linux 系统 所 带 来 的 麻烦 。 例 如 ， 
无 须 在 内 核 中 模拟 /proc 文件 系统 ， 因 为 这 是 JRockit 在 Linux 上 获取 内 存 信息 的 方法 。 此 外 ， 
还 可 以 移 除 一 些 操作 系统 调用 ， 例 如 mmap, 在 JRockit VE 中 ,， 它 看 起 来 像 是 POSIX 调用 , 但 实 
际 上 却 不 是 。 在 标准 的 POSIX F, mmap 的 实现 非常 复杂 , 但 在 JRockit VE 中 ， 只 是 为 了 伪装 成 
Linux 而 特意 实现 的 , 简化 了 一 些 操作 。 基 于 以 上 原因 , 将 JRockit 移植 到 JRockit VE 上 时 就 不 会 
太 复 杂 ， 因 为 JVM 中 用 到 的 系统 调用 都 已 经 存在 于 定义 良好 的 平台 抽象 层 中 了 。 

在 学 习 JRockit VE 内 核 时 , 千 万 不 要 被 它 误 导 , 虽然 它 看 起 来 像 个 轻 量 级 操作 系统 , 但 实际 
上 绝 不 是 操作 系统 ,很 多 操作 系统 应 有 的 复杂 机 制 都 被 舍弃 了 。 对 于 像 Linux 这 样 的 操作 系统 来 
说 ,设备 驱动 程序 的 复杂 性 远大 于 内 核 本 身 , 而 对 于 运行 在 虚拟 机 管理 程序 上 的 JRockit VE 来 说 ， 
这 完全 没 必要 ， 因 为 虚拟 机 管理 程序 会 处 理 好 和 硬件 设备 的 通信 。JRockit VE 内 核 模块 本 身 只 有 
KA 13 万 行 C 语 言 代 码 ， 其 中 大 部 分 都 是 网 络 栈 相关 的 代码 。 


13.2.2 ”虚拟 机 镜像 与 管理 框架 


现在 ,“ 虚 拟 云 ”( virtual cloud ) 是 个 非常 时 莒 的 词 ， 其 概念 理解 起 来 其 实 很 容易 ， 就 是 将 大 
量 计 算 机 资源 通过 互联 网 联系 起 来 统一 管理 ， 不 再 纠结 于 具体 的 某 台 计 算 机 或 某 个 具体 配置 。 

安装 在 物理 机 器 上 的 Java 应 用 程序 的 概念 也 众所周知 。 

目前 , 大 部 分 云 解决 方案 都 是 通过 某 种 管理 框架 来 管理 部 署 在 云 中 的 应 用 程序 , 通过 抽象 来 
移 除 对 指定 机 器 的 依赖 ， 以 实现 “ 云 就 是 计算 机 ”。 通 常 来 说 ， 会 在 云 服务 器 中 通过 管理 框架 来 
部 署 整 个 自 包含 的 客户 操作 系统 ， 例 如 虚拟 的 Linux 发 行 版 。 












































































































































































































































具体 来 说 ，Oracle VM Manager 就 是 一 种 云 管理 框架 ， 作 为 Oracle VM 本 地 
型 虚拟 机 管理 程序 的 一 部 分 来 发 行 。Oracle VM Manager 允许 系统 管理 员 对 服务 
器 集群 进行 配置 和 分 组 ， 并 在 云 中 部 署 虚 拟 机 镜像 。 


起 初 ，JRockit VE 雄心 勃勃 ， 按 照 “本 地 版 Java” 来 做 ， 和 希望 可 以 在 本 地 机 器 上 通过 命令 行 
来 启动 和 部 署 云 中 的 虚拟 应 用 程序 ， 虚 拟 应 用 程序 看 起 来 就 像 运 行 在 本 地 机 器 上 一 样 , 将 JVM 
的 控制 台 输 出 发 送 到 本 地 控制 台 可 以 实现 这 种 远程 操作 。 不 过 ， 这 产生 了 一 个 非常 复杂 的 概念 ， 
而 且 导 致 思路 混乱 : 应 用 程序 到 底 是 在 哪里 运行 的 ? 

在 alpha 版 发 布 之 后 ， 用 户 也 开始 试用 了 ， 而 此 时 JRockit VE 团队 决定 走 另 一 条 路 ， 即 将 本 
地 Java 应 用 程序 集成 到 虚拟 机 镜像 中 。 通 过 已 有 的 管理 框架 (例如 Oracle VM Manager )， 将 打 
包 好 的 二 进 制 文件 部 署 到 云 中 ,并 通过 管理 框架 来 执行 日 常 管理 , 例如 修改 虚拟 机 布局 、 迁 移 服 
务 器 等 。 
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一 般 来 说 ， 虚 拟 机 镜像 中 可 能 会 包含 任意 操作 系统 对 任意 机 器 的 配置 。JRockit VE 的 虚拟 机 
镜像 中 包含 了 供 Java 使 用 的 、 完 整 的 虚拟 机 规范 和 配置 ， 以 及 配套 的 文件 系统 。 

可 以 将 发 行 虚拟 机 镜像 (例如 WebLogic Server) 看 作 交 给 客户 一 台 物 理 机 器 ， 在 这 台 机 器 
上 预 装 了 某 个 版 本 的 WebLogic Server， 而 用 户 只 需要 给 机 需 通电 ， 接 上 网 络 连接 线 ， 启 动 服务 
器 就 大 功 告 成 了 。 这 里 和 现实 生活 中 的 区 别 主 要 在 于 ,并 不 是 真 的 给 用 户 一 台 物 理 机 器 ， 而 只 是 
把 机 器 的 相关 规范 ( 例如 内 存 限 制 、CPU 限制 等 ) 和 硬盘 中 的 克隆 镜像 交 给 用 户 。 云 服务 为 模拟 
机 需 提 供 必 要 的 资源 。 这 就 是 虚拟 化 。 

虚拟 机 镜像 中 包含 了 预 装 软件 ， 免 去 了 用 户 自 行 安装 的 麻烦 ， 这 也 是 虚拟 化 可 以 降低 IT 成 
本 的 原因 。 
























































通过 JRockit VE 自 带 的 Image Tool 工具 可 以 将 本 地 安装 的 应 用 程序 制 成 虚 
VIS 拟 机 镜像 ， 并 直接 部 署 到 云 服务 器 上 ， 这 种 用 例 称 为 “物理 到 虚拟 ”， 而 另 一 种 
用 例 则 是 用 户 不 再 自己 制作 虚拟 机 镜像 ， 而 是 直接 使 用 其 他 厂商 生成 的 虚拟 机 

镜像 。 


通过 JRockit VE 的 Image Tool 工具 (离线 ) 和 管理 框架 ( 在线 )， 可 以 控制 虚拟 机 的 方 方 面 
面 ， 例 如 虚拟 机 的 内 存 总 量 。 虚 拟 应 用 程序 所 需 的 虚拟 机 环境 各 有 不 同 ， 有 的 简单 ， 有 的 复杂 ， 
管理 起 来 颇 为 麻烦 。 

通过 工具 可 以 自动 生成 带 有 最 简化 配置 的 JRockit VE 虚拟 机 镜像 。 通 常 来 说 ， 只 需要 告知 
Image Tool 所 需 的 硬盘 大 小 、CPU 核 数 和 内 存 总 量 即 可 ,此 外 运行 Rockit VE 内 核 至 少 需要 有 一 
个 网 卡 接口 才 行 。 启 动 时 ， 如 果 有 DACP 协议 的 话 ，JRockit VE 内 核 会 先 通过 DACP 协议 来 简化 
网 络 配置 ; 若是 没有 DHCP 协议 ， 则 需要 显 式 配 置 虚拟 网 络 的 各 项 参数 。 

作为 虚拟 机 镜像 的 一 部 分 ， 在 运行 虚拟 的 Java 应 用 程序 时 就 可 以 使 用 虚拟 机 镜像 的 本 地 文 
件 系 统 了 

下 面 的 示例 是 JRockit VE 虚拟 机 的 配置 文件 ， 对 运行 在 虚拟 机 镜像 中 的 Java 应 用 程序 
HelloWorld 进行 了 描述 。 虚 拟 机 镜像 可 以 通过 Image Tool 工具 来 制作 ， 类 似 的 配置 文件 可 以 直接 
从 已 有 的 虚拟 机 镜像 中 获得 。 

JRockit VE 配置 文件 的 格式 是 独立 于 具体 虚拟 机 管理 程序 的 。 


<?xml version="1.0" encoding="UTF-8"?> 






























































<!-- helloworld.xml --> 
<jrockitve-imagetool-config xmlns:xsi="http:// 
www.w3.org/2001/XMLSchema-instance"xsi :noNamespaceSchemaLocation= 
"jJrockitve-imagetool-config.xsd" version="5.1"> 
<jrockitve-config memory="512 MB" cpus="1"> 
<storage> 
<disks> 
<disk id="root" size="256 MB"/> 
</disks> 
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<mounts> 
<mount> 
<mount-point>/</mount-point> 
<disk>root</disk> 
</mount> 
</mounts> 
</storage> 
<vm-name>helloworld-vm</vm-name> 
<java-arguments>-Xmx256M HelloWorld</java-arguments> 
<network> 
<nics> 
<nic/> 
</nics> 
</network> 
</jrockitve-config> 
<jrockitve-filesystem-imports> 
<copy from="~/myLocalApp/HelloWorld/*" to="/"/> 
</jrockitve-filesystem-imports> 
</jrockitve-imagetool-config> 


以 上 配置 文件 指定 了 虚拟 机 需要 512 MB 内 存 、 一 个 CPU 核心 和 一 块 256 MB 大 小 的 硬盘 。 
在 部 署 虚拟 机 镜像 后 ,就 可 以 在 管理 框架 中 看 到 名 为 helloworld-vm 的 虚拟 机 。 启 动 时 ,JRockit VE 
内 核 会 调用 JRockit, JRockit 则 启动 名 为 HelloWorld 的 Java 应 用 程序 ， 该 程序 的 .class 文件 及 其 
他 资源 文件 存放 在 虚拟 机 硬盘 的 根 路 径 下 。 虚 拟 机 中 还 包含 有 一 块 网 卡 , 由 于 没有 其 他 特殊 配置 ， 
JRockit VE 内 核 会 在 启动 时 通过 DACP 来 设置 虚拟 机 的 网 络 参数 。 

下 面 的 几 个 命令 展示 了 如 何 使 用 Image Tool 来 制作 虚拟 机 镜像 ， 以 及 如 何在 部 署 前 对 其 修 
改 。 默 认 情 况 下 ，Image Tool 会 生成 一 个 标准 的 Xen 或 Oracle VM 配置 , 包括 名 为 vm.cfg 的 配置 
文件 , 名 为 system.img 的 系统 镜像 和 虚拟 硬盘 。 在 虚拟 硬盘 中 包含 了 Java 应 用 程序 , JRockit JRE 
和 JRockit VE 内 核 。 
































hastur:marcus$ java -jar jrockitve-imagetool.jar 


Usage: java -jar jrockitve-imagetool.jar [options] 


-h, --help [<option_name>] 

-c, --create-config [<config_file.xml>] [<vm_name>] 
--create-full-config [<config_file.xml>] [<vm_name>] 

-r, --reconfigure <vm_cfg> <op> <field> [<parameter>] * 


--reconfigure-service <vm cfg> <service-name> 
<op> <field> [<parameter>]* 


-f, --file <vm cfg> <operation> [<parameter>] * 
--get-log <vm_cfg> [<output file>] 
--repair <vm cfg> [<auto|prompt|check>] 

-p, --patch <vm cfg> <patch file> 

-a, --assemble <config.xml> <output dir> [<hypervisor>] 

-d, --disassemble <vm_cfg><output_dir> 

-v, --version [<vm_cfg>|<jrockitve_image>] 

-1, --log (#) <quiet | brief | verbose |debug> 


--force (#) 
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Options marked "#" are not standalone. 


They must be used together with other options 


hastur:marcus$ java -jar jrockitve-imagetool.jar 
--assemble helloworld.xml /tmp/outputdir 


Assembling the image... 


Wrote 127 MB 
Done 


hastur:marcus$ 1s -lart /tmp/outputdir/ 


total 327688 


drwxrwxrwt 18 root 612 
-rw-r--r-- 1 marcus 270 
-rw-r--r-- 1 marcus 268435456 
drwxr-xr-x 4 marcus 136 


Aug 29 11:09 

Aug 29 11:10 vm.cfg 
Aug 29 11:10 system.img 
Aug 29 11:10 


hastur:marcus$ java -jar jrockitve-imagetool.jar 
--reconfigure /tmp/outputdir/vm.cfg get java-arguments 


-Xmx256M HelloWorld 


hastur:marcus$ cat /tmp/outputdir/vm.cfg 


# OracleVM config file for 'helloworld-vm'. 
# Can be used with 'xm <start|create> [-c] vm.cfg' 


# 


# note that Xen requires an absolute path to the image! 


name="helloworld-vm" 
bootloader="/usr/bin/pygrub" 
memory=512 


disk=['tap:aio:/OVS/seed_pool/helloworld-vm/system.img,sdal,w'] 


vif=[''] 
on_crash="coredump-destroy" 








假设 现在 已 经 做 好 了 虚拟 机 镜像 ， 接 下 来 就 可 以 通过 Rockit VE Image Tool 工具 来 查询 和 重 
设 虚 拟 机 配置 了 。 下 面 的 示例 通过 Image Tool 工 具 修改 了 虚拟 机 的 CPU 核 数 ， 而 这 会 改变 虚拟 
机 管理 程序 的 配置 文件 ， 进 而 可 能 会 改变 虚拟 机 镜像 文件 〈 例子 中 的 system.img )。 在 虚拟 机 管 









































理 程序 的 配置 文件 中 , 组 装 起 来 的 镜像 文件 与 





VM 或 Xen AY vm.cfg )。 





aa 








0 置 文件 应 该 是 一 一 对 应 的 (例子 中 用 于 Oracle 





hastur:marcus$ java -jar jrockitve-imagetool.jar 
--reconfigure /tmp/outputdir/vm.cfg get cpus 


hastur:marcus$ java -jar jrockitve-imagetool.jar 
--reconfigure /tmp/outputdir/vm.cfg set cpus 4 
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Done 
hastur:marcus$ cat /tmp/outputdir/vm.cfg 


# OracleVM config file for 'helloworld-vm'. 

# Can be used with 'xm <start|create> [-c] vm.cfg' 

# 

# note that Xen requires an absolute path to the image! 


name="helloworld-vm" 

boot loader="/usr/bin/pygrub" 

memory=512 

disk=['tap:aio: /OVS/seed_pool/helloworld-vm/system.img,sdai,w'] 
vif=[''] 

vcepus=4 #<--- we now have 4 virtual CPUs 
on_crash="coredump-destroy" 


组 装 起 来 的 虚拟 机 镜像 也 可 以 通过 Image Tool © HIRE (disassemble ) 4 > 

散 的 组 件 ， 对 于 终端 用 户 来 说 ， 这 种 场景 ( 虚拟 到 物理 ) 与 组 装 场景 ( 物理 到 虚 

m) 类 似 ， 并 非 是 唯一 可 用 的 方式 。 在 实际 工作 中 ,用户 可 能 会 使 用 Image Tool 
拆 解 虚拟 机 镜像 后 做 一 些 定制 化 修改 ， 然 后 再 重新 打包 使 用 。 


除了 操作 虚拟 机 镜像 外 ，Image Tool 还 可 以 对 镜像 打 补 丁 ， 以 便 修复 故障 、 更 新 软件 (例如 
JRockit VE 内 核 或 WebLogic server ) 等 。 因此, 可 以 通过 补丁 包 的 形式 升级 预 打 包 的 虚拟 机 镜像 ， 
而 无 须 把 镜像 拆 下 来 再 做 修改 。 

Image Tool 还 可 用 于 执行 一 些 离线 操作 ， 例 如 从 虚拟 应 用 程序 中 抽取 日 志文 件 信 息 ， 或 者 启 
用 JRockit VE 镜像 中 预 装 的 SSH 服务 。 即 便 是 补丁 管理 框架 支持 对 补丁 做 版 本 控制 ， 也 需要 某 
种 安全 机 制 来 保证 打 补 丁 能 够 正确 完成 , 例如 打 补 丁 时 先 把 文件 备份 一 下 , 万 一 打 补 丁 时 出 现 错 
DR, 还 可 以 把 文件 恢复 回来 。 

在 下 面 的 示例 中 , 先 查 询 了 JRockit VE 虚拟 机 镜像 中 包含 了 哪些 服务 , 接着 启动 其 中 的 SSH 
守护 进程 。 












































hastur:marcus$ java -jar jrockitve-imagetool.jar -r 
/tmp/outputdir/vm.cfg get installed-services 


sshd (An SSH2 implementation with SCP and SFTP support) 
jmxstat (JRockitVE kernel statistics MBean) 
sysstat (JRockitVE kernel sysstat statistics) 


hastur:marcus$ java -jar jrockitve-imagetool.jar -r 
/tmp/outputdir/vm.cfg get enabled-services 


None 


hastur:marcus$ java -jar jrockitve-imagetool.jar -r 
/tmp/outputdir/vm.cfg enable service sshd 
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Done 


hastur:marcus$ java -jar jrockitve-imagetool.jar -r 
/tmp/outputdir/vm.cfg get enabled-services 


sshd (An SSH2 implementation with SCP and SFTP support) 


在 一 个 运行 中 的 虚拟 机 镜像 里 启动 SSH 服务 后 ,虚拟 机 会 根据 预先 配置 的 认证 策略 响应 SCP 
All SFTP 请 求 。 
最 后 , 还 可 以 使 用 Image Tool 工具 操作 虚拟 机 镜像 中 的 文件 系统 , 例如 在 其 中 创建 或 删除 文 
件 和 目录 ， 并 且 可 以 将 文件 在 本 地 文件 系统 和 虚拟 机 文件 系统 中 做 双向 复制 。 


hastur:marcus$ java -jar jrockitve-imagetool.jar 
--file /tmp/outputdir/vm.cfg ls / 





| 








[Feb 04 2010] boot / 
[Feb 04 2010] jrockitve/ 
[Feb 04 2010] lost+found/ 
[Feb 04 16:00 498 bytes] HelloWorld.class 
[Feb 04 16:00 358 bytes] VERSION 
Done 


hastur:marcus$ java -jar jrockitve-imagetool.jar 
--file /tmp/outputdir/vm.cfg get HelloWorld.* /tmp 


Done 
hastur:marcus$ ls -1 /tmp/HelloWorld* 


-rw-r--r-- marcus wheel 489 Feb 14 15:36 /tmp/HelloWorld.class 


13.2.3. JRockit VE 的 优势 
使 用 JRockit VE 作为 虚拟 化 解决 方案 主要 有 以 下 几 种 优势 : 
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接 下 来 的 章节 将 分 别 介绍 上 述 优势 。 

1. 性 能 与 更 高 的 资源 利用 率 

JRockit VE 的 高 性 能 主要 源 于 两 方面 ， 其 中 之 一 就 是 移 除 了 不 必要 的 抽象 层 。 在 专门 的 虚拟 
环境 中 ， 移 除 由 JVM、OS 和 虚拟 机 管理 程序 组 成 的 “虚拟 三 件 套 ”是 可 以 提升 整体 性 能 的 。 

另 一 方面 ， 在 虚拟 机 管理 程序 和 JVM 之 间 还 有 一 些 中 间 区 域 ， 这 些 区 域 可 以 提供 很 多 性 能 
相关 的 数据 , 运用 正确 的 话 ， 甚 至 可 以 使 虚拟 环境 的 整体 性 能 强 于 真实 的 物理 机 器 ， 虽 然 听 起 来 
不 太 真实 ， 但 还 是 有 可 能 的 ， 后 面 会 详细 介绍 这 部 分 内 容 。 












































13.2 Java 虚拟 化 285 





o 移 除 “虚拟 三 件 套 ” 

在 普通 操作 系统 中 ， 需 要 以 较 高 的 权限 来 执行 一 些 某 些 特殊 操作 ( 例如 系统 调用 )。 现 代 硬 
件 中 或 多 或 少 会 有 一 些 层级 保护 域 (hierarchical protection domain )， 从 最 低 权 限 访问 空间 (用户 
空间 ) 到 最 高 权限 访问 空间 ( 内 核 空间 )， 所 有 的 代码 都 会 运行 在 这 些 层 级 保护 域 中 。 在 x86 体 
系 中 ， 这 些 层级 保护 域 称 为 Ring。Ring 的 等 级 越 低 ， 其 所 表示 的 权限 越 高 。Ring 0 具有 最 高 访 
问 权限 ,表示 访问 内 核 空间 。 男 一 方面 用户 态 (user mode ) 的 代码 必须 要 运行 在 权限 较 低 的 层 
级 下 。 若 是 用 户 需 要 执行 高 权限 操作 (例如 系统 调用 )， 则 CPU 需要 改变 Ring 的 级 别 ， 这 个 操 
作 的 开销 很 大 ， 需 要 执行 同步 操作 ， 而 且 可 能 不 得 不 销毁 缓存 的 所 有 数据 。 

JRockit VE 内 核 中 包含 有 与 操作 系统 类 似 的 子 系统 , 由 于 它 是 通过 虚拟 机 管理 程序 来 与 硬件 
交互 的 ， 大 部 分 情况 下 ， 它 都 是 工作 在 Ring 3 (用 户 态 ) 等 级 下 的 ， 省 去 了 改变 Ring 等 级 的 操 
作 (在 某 些 场景 下 ， 还 是 需要 的 )。 







































































这 里 简单 说 说 虚拟 机 管理 程序 的 实现 细节 ,以 便 更 好 地 理解 保护 域 的 工作 原 
理 。 在 x86 体系 下 ， 庶 拟 的 客户 操作 系统 通常 以 Ring 1 来 运行 它 的 内 核 操作 ， 
将 Ring 0 留 给 虚拟 机 管理 程序 使 用 。 


下 面 的 示意 图 展示 了 ,JVM 中 网 络 系统 调用 的 执行 路 径 在 普通 Linux 系统 和 JRockit VE 内 核 
中 的 区 别 (垂直 的 虚线 为 时 间 轴 )。 







































































java.net libe TCPAP | | 设备 绒 动 程 局 LTE Ry) | 设备 最 动 程序 E1000 


| 发送 j lye (Ring 3- | 


| PEO ye | | : 
Bo | TS s y sige” 1oPort | ! 
2 | | | | sd 传输 A fz 
"E | | | | ] 

| 发 送 、 | | ! 
> ey ime | | | 
ao | ee | ! 
2 | : is ome 





如 图 所 示 , 在 普通 Linux 系统 中 , 网 络 系统 调用 发 起 于 java.net 包 中 的 Java KA, 控制 流 
逐步 通过 各 个 层级 ， 最 终 达 到 硬件 网 卡 ,通过 网 卡 驱动 程序 执行 汇编 指令 。 其 执行 路 径 中 的 虚线 
表示 执行 开销 很 大 的 特权 操作 ， 例 如 改变 Ring 等 级 等 。 同 样 的 网 络 系统 调用 ， 在 JRockit VE 内 
核 中 ， 就 可 以 以 很 小 的 执行 开销 完成 。 
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这 个 示例 说 明 ， 如 果 能 用 专门 的 中 间 层 代替 操作 系统 ， 就 可 以 极 大 降低 虚拟 化 的 执行 开销 ， 
这 正 是 JRockit VE 一 大 卖点 。 正 如 前 面 介绍 的 ， 云 计算 的 一 大 问题 就 是 虚拟 化 的 性 能 开销 。 相 比 
于 传统 虚拟 化 解决 方案 , Rockit VE 使 用 专门 的 中 间 层 代替 普通 操作 系统 , 极 大 地 降低 了 执行 开销 。 

@ 内 存 使 用 量 

JRockit VE 内 核 是 一 个 自 包含 的 启动 镜像 , 大 小 只 有 几 兆 字 节 。 除 了 几 个 配置 文件 和 JRE 以 
外 , 这 就 是 虚拟 机 镜像 的 全 部 大 小 了 。 现 在 操作 系统 的 实现 动 辑 上 百 兆 字 节 , LIL KF JRockit VE 
的 体积 。 

如 此 小 的 JRockit VE 内 核 使 系统 可 以 将 更 多 的 内 存 用 于 运行 Java 应 用 程序 ， 对 于 普遍 使 用 
32 位 系统 的 云 主机 来 说 ， 这 是 很 重要 的 。 

2. 可 管理 性 

可 管理 性 包含 两 个 方面 ， 离 线 管 理 ( offline manageability ) 和 在 线 管理 (online manageability )。 
其 中 ， 离 线 管 理 是 指 对 虚拟 机 镜像 的 管理 ， 在 线 管理 是 指 在 云 计 算 环 境 中 部 署 和 控制 虚拟 机 。 

对 于 还 未 部 署 的 JRockit VE 虚拟 机 镜像 来 说 ， 可 以 通过 随 JRockit VE 及 其 衍生 品 〈 例如 
WebLogic Server ) 一 起 发 布 的 Image Tool 来 对 其 各 个 方面 (例如 文件 系统 、 虚 拟 机 配置 、 服 务 等 ) 
进行 离线 操作 。 

另 一 方面 , 如果 JRockit VE 虚拟 机 镜像 符合 某 种 虚拟 机 管理 程序 的 特定 格式 , 则 可 以 使 用 该 
虚拟 机 管理 程序 ( 例如 Oracle VM Manager ) 对 其 进行 管理 。 

作为 一 个 成 熟 的 产品 ，Oracle VM Manager 使 系统 管理 员 可 以 同时 管理 多 个 虚拟 化 版 本 的 
Oracle Enterprise Linux， 并 且 可 以 几乎 不 做 任何 修改 就 能 运行 虚拟 机 镜像 中 的 应 用 ， 例 如 运行 于 
JRockit VE 之 上 的 WLS。 对 于 管理 框架 来 说 ， 这 些 WebLogic 之 类 ( WebLogic blob ) 的 虚拟 应 用 
程序 与 其 他 虚拟 的 客户 应 用 程序 一 样 ， 照常 运行 即 可 。 这 种 强大 的 适应 能 力 , 使 JRockit VE 无须 
再 为 运行 哪些 应 用 程序 而 操心 ， 进 而 可 以 从 虚拟 机 镜像 中 无 颖 地 移 除 标准 操作 系统 。 

3. 简单 又 安全 

简单 不 一 定 就 安全 ， 不 过 对 于 Rockit VE 来 说 ， 它 确实 是 简单 又 安全 的 。 

通用 操作 系统 非常 复杂 , 包含 了 大 量 系 统 守 护 进 程 和 像 Web 浏览 器 、e-mail 这 类 的 用 户 应 用 
程序 ， 并 且 提 供 了 通用 多 任务 运行 环境 ， 可 以 同时 运行 多 个 进程 。 对 于 这 种 操作 系统 来 说 , 一般 
会 有 多 个 接 入 点 来 访问 运行 了 其 他 标准 操作 系统 的 远程 工作 站 ， 例 如 开放 的 端口 ， 登 录 协议 等 。 

由 于 JRockit VE 内 核 仅仅 提供 了 可 以 运行 JVM 的 有 限 功能 ， 相 比 于 通用 操作 系统 来 说 ， 其 
复杂 性 大 大 降低 。 正 如 前 文 提 到 的 , 在 JRockit VE 内 核 中 只 预 装 了 SSH 守护 进程 ， 以 便 实现 远程 
访问 ， 而 且 默 认 情 况 下 ， 该 服务 是 禁用 的 ， 需 要 由 虚拟 机 镜像 的 创建 者 手动 开启 。 访 问 人 口 少 ， 
禁用 本 地 代码 ，JVM 校 验 危险 代码 ， 所 有 这 些 加 在 一 起 保证 了 JRockit VE 的 高 安全 性 。 

此 外 ，JRockit VE 内 核 本 身 只 会 运行 JVM 这 一 个 进程 ， 因 此 也 就 不 存在 进程 和 资源 隔离 的 
问题 ， 进 一 步 增强 了 JRokcit VE 的 安全 性 。 

JVM 按照 JVM 规范 的 要 求 来 维持 Java 应 用 程序 的 安全 性 。 禁 用 本 地 代码 ， 沙 箱 式 的 JVM 
模型 就 可 以 更 好 地 保护 系统 免 受 危险 代码 和 缓冲 区 溢出 的 威胁 。 以 内 存 管理 来 说 ，JVM 自己 就 
可 以 干 得 不 错 ,也 就 不 需要 再 引入 其 他 内 存 保护 措施 ,所 有 这 些 使 及 ockit VE 内 核 既 简单 又 安全 。 
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般 来 说 , 通用 操作 系统 可 以 为 用 户 设置 不 同 的 访问 权限 , 这 种 权限 设置 会 一 直 影 响 到 进程 
和 文件 系统 层面 。 就 Rockit VE 内 核 来 说 ， 实 际 上 是 没有 用 户 的 ， 只 有 一 个 隐 式 的 JVM 进程 所 
有 者 ， 而 对 用 户 的 管理 则 交 由 Java 应 用 程序 完成 。 常 见 的 用 例 是 运行 一 个 应 用 程序 服务 顺 来 处 
理 这 些 任 务 ， 因 为 它 内 建 了 用 户 账户 和 访问 权限 的 控制 。 事 实 上 ， 将 用 户 访问 控制 外 包 给 Java 
应 用 程序 来 处 理 没什么 问题 ， 既 不 会 限制 正常 使 用 ， 也 不 会 带 来 安全 问题 。 
对 于 通用 操作 系统 来 说 ,系统 配置 颇 为 麻烦 , 涉及 多 种 工具 和 文件 , 而 对 JRockit VE 来 说 简 
直 是 轻松 愉快 ， 只 需要 修改 一 个 配置 文件 即 可 , 可 以 通过 现 有 的 管理 框架 来 修改 ， 或 者 修改 一 个 
自动 生成 的 配置 文件 。 







































































预 估 数 量 JRockit VE JeOS Linux 
配置 文件 1 100 1000 
命令 10 500 3000 
命令 /内 核 参数 100 10 000 50 000 
管理 工具 1 200 500 
大 小 (MB ) 3 (*) 200 1000 
相对 于 JRockit VE 的 平均 比率 1 50 500 

















上 表 粗 略 地 比较 了 通用 操作 系统 ( 某 个 Linux 服务 需 的 发 行 版 ) 精简 操作 系统 ( 以 JeOS 为 
例 ) FI JRockit VE 的 区 别 。 对 于 小 系统 来 说 , 保证 安全 性 还 是 比较 容易 的 , 但 随 着 系统 规模 和 复 
性 的 增加 ， 安 全 性 问题 也 会 随 之 升级 。 























JRockit VE 中 内 置 了 JRE, 但 其 实 JRE 的 安装 部 署 本 应 该 是 由 用 户 自己 处 理 
> 的 ， 因 此 它 其 实 是 和 Java 应 用 程序 处 于 同一 层面 的 软件 。 


13.2.4 JRockit VE 的 限制 


JRockit VE 主要 有 两 大 限制 ， 即 不 支持 JNI 和 GUI. 

正如 前 面 提 到 的 , JRockit VE 内 核 只 支持 纯 Java 代码 , 因为 若是 支持 本 地 代码 的 话 就 需要 在 
安全 性 上 大 做 文章 ， 需 要 实现 一 个 更 复杂 更 完整 的 操作 系统 。 对 于 那些 通常 是 使 用 纯 Java 编写 
的 应 用 服务 器 来 说 ,支持 本 地 代码 并 无 太 大 必要 ,因此 禁用 JNI 不 会 有 什么 问题 。 当 然 , JVM 运 
行 时 自身 会 调用 一 些 本 地 代码 ， 这 些 代 码 可 以 确定 是 安全 无 害 的 。 

目前 , JRockit VE 只 能 通过 其 控制 台 来 导出 信息 , 不 支持 GUI, 输出 内 容 也 只 能 是 普通 文本 ， 
例如 写 人 到 System.out 和 System.err 中 的 字符 文本 。 当 然 ， 可 以 将 控制 台 输出 重 定 向 到 本 地 文件 
系统 或 网 络 文件 系统 的 文件 中 。 对 于 服务 器 端 应 用 程序 来 说 ，GUI 界 面 并 无 必要 。 
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移 除 不 必要 的 中 间 虚 拟 层 只 是 性 能 优化 的 第 一 步 ， 如 果 能 控制 操 作 系 统 层 , 使 VM 知道 该 13 
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如 何 与 其 通信 的 话 ， 就 能 使 JVM 获得 更 多 重要 信息 ， 进 而 极 大 地 扩展 自 适 应 运行 时 的 能 





这 一 节 的 内 容 更 趋向 于 推测 ， 其 中 所 设计 到 的 技术 并 未 在 现实 世界 中 加 以 
验证 ， 在 将 来 可 能 会 发 生变 化 ， 但 不 出 意外 的 话 ， 它 们 应 该 就 是 高 性 能 虚拟 化 
的 基础 。 


13.3.1 高 质量 的 热点 代码 采样 


提高 热点 代码 采样 信息 的 质量 可 以 提升 系统 的 整体 性 能 。 在 第 2 章 中 曾 介 绍 过 , 采样 信息 越 
详细 ,代码 优化 的 质量 就 越 高 。 如 果 我 们 运行 自己 的 调度 器 , 并且 完 全 控制 系统 中 所 有 的 线程 的 
话 ， 例 如 Rockit VE 内 核 就 是 这 么 做 的 ， 采 样 的 开销 会 急剧 增 大 。 若 想 查找 Java 指令 寄存 器 的 
内 容 ， 无 须 调用 开销 巨大 的 操作 系统 调用 (改变 Ring 级 别 ) 来 暂停 所 有 的 应 用 程序 线程 。 如 果 
通过 JVM 内 部 实现 的 绿色 线程 (参见 第 4 章 内 容 ) 来 实现 ， 启 动 和 终止 绿色 线程 的 开销 极 小 ， 
跟 操 作 系 统 线程 相 比 完全 不 是 一 个 数量 级 。JRockit VE 中 的 线程 实现 与 绿色 线程 瞩 有 相似 之 处 。 

JRockit VE 中 的 采样 质量 堪 比 基于 硬件 的 采样 ( 参见 第 2 章 ), 使 JVM 能 够 获得 更 多 的 运行 
时 信息 ， 为 指定 优化 策略 提供 数据 支持 ， 提 升 决策 的 准确 性 。 


13.3.2 Bisex) 


除了 采样 信息 之 外 ， 男 一 个 性 能 提升 点 在 于 启用 堆 大 小 的 自 适 应 调整 ( adaptive heap resizing )。 

大 多 数 虚拟 机 管理 程序 都 支持 名 为 膨胀 (ballooning ) 的 技术 ， 该 技术 使 虚拟 机 管理 程序 和 
客户 应 用 程序 可 以 协商 内 存 的 使 用 情况 ,无 须 破坏 各 个 客户 应 用 程序 之 间 的 沙 箱 模 型 。 具体 是 实 
现 一 个 膨胀 驱动 程序 ( balloon driver) 的 中 间 层 ， 为 客户 应 用 程序 提供 一 个 伪 虚 拟 设备 ， 虚 拟 机 
管理 程序 通过 该 伪 虚 拟 设备 提示 客户 应 用 程序 需要 扩大 内 存 。 当 内 存 不 足 , 需要 回收 一 些 其 他 客 
户 应 用 程序 占用 的 内 存 时 , 客户 应 用 程序 可 以 通过 膨胀 驱动 程序 解析 出 由 虚拟 机 管理 程序 发 出 的 
有 关 “ 扩 大 内 存 ” 的 提示 。 

此 外 ,膨胀 还 可 以 实现 内 存 的 超 量 使 用 , 例如 使 各 个 客户 应 用 程序 占用 的 总 内 存 可 以 超过 物 
理 内 存 的 总 量 。 鉴 于 该 技术 可 用 于 实现 无 换 页 操作 ， 可 以 说 是 非常 强大 的 技术 。 

HF JVM 中 Java 堆 所 占用 的 内 存 总 量 比 JRockit VE 内 核 所 占用 的 本 地 内 存 总 量 大 上 几 个 数 
量 级 ， 对 于 虚拟 机 管理 程序 来 说 ， 回 收 内 存 最 有 效 的 方式 就 是 对 Java 堆 做 伸缩 处 理 。 如 果 虚 拟 
机 管理 程序 通过 膨胀 驱动 程序 报告 内 存 压 力 过 大 ， 则 JVM 应 该 通过 外 部 API (所谓 “外 部 ”， 是 
指 JRockit VE 调用 JVM 的 接口 ) 来 收缩 Java 堆 ， 这 个 调用 可 能 会 触发 Java 堆 的 内 存 整理 操作 。 

另 一 方面 ， 如 果 垃 圾 回收 的 执行 时 间 过 长 ， 则 JVM 应 该 询问 Rockit VE 内 核 是 否 需 要 通过 
虚拟 机 管理 程序 回收 一 些 内 存 。 这 个 询问 操作 只 存在 于 JRockit 和 棚 ockit VE 平台 ,是 作为 JRockit 
VE 平台 抽象 层 供 JVM 使 用 的 。 

传统 的 操作 系统 并 不 支持 提示 进程 需要 释放 或 增加 内 存 的 操作 , 而 自 适应 内 存 管理 却 可 以 完 
成 这 项 任务 ， 可 以 说 是 开启 了 新 的 篇 章 。 因 此 ，JRockit VE 能 够 保证 JVM 可 以 恰到好处 地 使 用 
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内 存 ， 及 时 释放 内 存 供 其 他 客户 应 用 程序 使 用 ,避免 因 换 页 操作 〈 内 存 不 足 时 可 能 需要 执行 换 页 
操作 ) 而 带 来 的 性 能 开销 (这 开销 很 大 )。 这 个 特性 使 及 ockit VE 非常 适合 作为 虚拟 环境 来 运行 
Java 应 用 程序 ， 可 以 及 时 调整 各 个 客户 应 用 程序 的 运行 配置 ， 最 大 化 资源 利用 率 。 


13.3.3 ”线程 间 的 页 保护 


移 除 JVM 和 硬件 之 间 的 操作 系统 层 可 能 会 带 来 意 想 不 到 的 大 收益 。 

回想 一 下 标准 操作 系统 中 进程 和 线程 的 概念 ,就 定义 来 说 , 同一 进程 中 的 线程 会 共享 虚拟 内 
TE, 而 且 并 没有 内 置 的 内 存 保护 机 制 来 保护 线程 对 内 存 的 并 发 访问 , 但 不 同 进 程 则 肯定 不 能 访问 
对 方 的 内 存 数据 。 现 在 假设 每 个 线程 都 可 以 保留 一 部 分 其 他 线程 无 法 访问 的 内 存 ( 当然 其 他 进 
程 的 线程 就 更 不 能 了 )。 如 果 某 个 线程 试图 访问 另 一 个 线程 的 私有 内 存 区域 ， 则 可 能 会 产生 一 个 
页 错误 (page fault )。 这 种 机 制 与 标准 操作 系统 中 的 页 保护 相 类 似 ， 只 不 过 控制 粒度 更 精细 ， 实 
现 这 个 机 制 并 不 复杂 ，JRockit VE 就 是 通过 改变 线程 的 定义 来 实现 的 。 

对 于 标准 操作 系统 来 说 , 若 想 在 JVM 实现 这 种 快速 、 透 明 的 线程 内 页 保护 机 制 是 不 可 能 的 ， 
但 对 于 像 JRockit VE 内 核 这 样 的 “操作 系统 ”来 说 ， 那 就 小 菜 一 碟 了 。Oracle 已 经 就 这 种 技术 申 
请 了 多 项 专利 。 

下 面 两 个 小 节 的 内 容 阐述 了 这 项 技术 强大 的 威力 。 

1. 改进 垃圾 回收 

正如 第 3 章 中 介绍 的 , 在 Java 中 实现 线程 局 部 对 象 分 配 是 大 有 神 益 的 , 可 以 避免 重复 在 Java 
堆 中 创建 对 象 ， 由 于 在 堆 中 创建 对 象 需要 做 同步 处 理 ， 会 带 来 额外 的 性 能 开销 。 

此 外 ， 由 于 绝 大 部 分 Java 对 象 的 生命 周期 都 非常 得， 将 之 存放 在 年 轻 代 可 以 提升 垃圾 回收 
的 吞吐 量 。 对 于 很 多 Java 应 用 程序 来 说 ， 大 部 分 对 象 的 生命 周期 都 只 限于 线程 内 部 ， 在 其 他 线 
程 看 到 该 对 象 之 前 就 会 回收 掉 。 

如 果 能 够 以 较 低 的 开销 将 线程 局 部 分 配 扩展 为 更 小 的 、 自 包含 的 线程 局 部 堆 (thread local 
heap )， 理 论 上 是 可 以 大 幅 提升 系统 整体 性 能 的 。 就 具体 实现 来 说 ， 就 是 保证 目标 对 象 只 会 在 当 
前 线程 内 使 用 , 则 对 线程 局 部 堆 的 垃圾 回收 可 以 以 无 锁 的 方式 完成 。 如 果 程 序 中 所 用 到 的 对 象 都 
只 存活 于 线程 内 的 话 ， 则 实现 无 延迟 、 无 暂停 的 垃圾 回收 就 不 再 是 梦想 了 。 当 然 ， 目 前 这 只 是 设 
想 而 已 。 由 于 线程 局 部 堆 之 间 是 相互 隔离 的 ， 对 各 个 线程 局 部 堆 的 垃圾 回收 可 以 分 开 执 行 ， 有 助 
于 降低 垃圾 回收 造成 的 系统 延迟 。 

除了 线程 局 部 堆 之 外 ,全 局 堆 ( 一般 来 说 , 会 占用 系统 内 存 的 大 部 分 空间 ) 用 于 放置 共享 于 
各 个 线程 之 间 的 对 象 , 因而 需要 使 用 标准 垃圾 回收 操作 。 全 局 堆 中 的 对 象 可 能 会 引用 线程 局 部 堆 
中 的 对 象 ， 因 此 在 对 线程 局 部 堆 做 垃圾 回收 时 ， 垃 圾 回收 器 需要 额外 处 理 这 种 关联 关系 。 

实现 这 种 机 制 的 主要 问题 在 于 如 何 识别 出 对 象 的 线程 可 见 性 ( 是 否 可 被 其 他 线程 看 到 ) 的 改 
变 。 对 线程 局 部 堆 中 对 象 的 属性 做 读 写 操作 都 可 能 会 改变 其 线程 可 见 性 , 可 能 需要 将 目标 对 象 从 
线程 局 部 堆 提 升 到 全 局 堆 中 。 为 简化 实现 ， 可 以 禁用 两 个 不 同 线程 局 部 堆 中 的 对 象 互 相 引 用 。 

对 于 标准 操作 系统 来 说 ， 若 想 在 标准 JVM 实现 这 种 机 制 ， 需 要 在 读 写 对 象 属性 时 添加 读 屏 
障 和 写 屏 障 , 执行 开销 不 小 。 屏障 需要 检查 访问 对 象 的 线程 和 创建 对 象 的 线程 是 否 相 同 , 若 不 同 ， 
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而 且 该 对 象 之 前 从 未 被 其 他 线程 看 到 过 , 则 需要 将 该 对 象 提 升 到 全 局 堆 中 ; 如 果 是 创建 者 线程 访 
问 自己 创建 的 对 象 ， 则 让 对 象 留 在 线程 局 部 堆 中 就 好 。 

这 种 机 制 的 伪 代 码 如 下 所 示 : 

// 以 "Xx.field" 的 形式 访问 对 象 的 实例 属性 


void checkReadAccess (Object x) { 
int myTid = getThreadId(); 














// 车 该 实例 是 线程 局 部 内 的 ， 而 且 属 于 另 一 个 线程 ， 则 将 其 放置 到 全 局 堆 中 
if (!x.isOnGlobalHeap() && !x.internalTo(myTid)) { 
x.evacuateToGlobalHeap(); 
} 
} 
// YA"x. field = Y" 的 形式 访问 对 象 的 实例 属性 
void checkWriteAccess (Object x, Object y) { 
if (x.isOnGlobalHeap() && !y.isOnGlobalHeap()) { 
GC.registerGlobalToLocalReference(x, y); 
} 
} 


在 64 位 机 器 上 ， 内 存 地 址 空间 大 而 稳定 ， 因 此 在 实现 时 ， 可 以 使 用 对 象 地址 的 部 分 二 进 制 
位 来 标记 对 象 从 属于 哪个 线程 局 部 堆 。 这 样 在 实现 读 屏 障 和 写 屏 障 的 快速 路 径 时 ， 只 需要 几 条 汇 
编 指令 就 可 以 判断 出 对 象 是 否 还 只 在 线程 内 可 见 。 不 过 , 就 算是 所 有 访问 对 象 的 操作 都 源 自 于 创 
建 者 线程 ， 这 种 线程 可 见 性 的 检查 还 是 会 带 来 一 些 性 能 开销 ,浪费 宝贵 的 寄存 器 资源 ， 因 为 每 个 
读 屏 障 和 写 屏障 都 需要 执行 额外 的 本 地 指令 ， 自 然 地 ， 对 于 慢 速 路 径 "来 说 ， 开 销 就 更 大 了 。 
Osterdahl 等 人 的 研究 表明 ， 读 写 屏障 所 产生 的 执行 开销 使 其 不 适合 在 通用 操作 系统 中 实现 
JVM 的 线程 届 部 垃圾 回收 。 但 如 果 能 在 线程 级 实现 页 保护 机 制 的 话 ， 则 至 少 可 以 使 读 屏 障 的 实 
现 更 轻 , 具体 实现 来 说 ,可 以 在 非 创建 者 线程 访问 其 他 线程 的 线程 局 部 堆 中 的 对 象 时 ,触发 一 个 
页 错误 来 通知 系统 需要 改变 对 象 的 线程 可 见 性 ， 这 样 就 不 必 显 式 地 执行 屏障 代码 了 。 












































































































































当然 , 即便 是 提升 了 读 屏 障 和 写 屏 障 的 执行 性 能 , 但 由 于 对 象 可 能 会 被 频繁 
地 提升 到 全 局 堆 中 ， 线 程 局 部 垃圾 回收 仍 会 增加 系统 整体 的 执行 开销 。 以 生产 
者 -消费 者 模型 为 例 ， 生 产 者 线程 创建 的 对 象 会 不 断 地 被 消费 者 线程 所 获取 ， 因 
> 而 完全 不 应 该 使 用 线程 局 部 垃圾 回收 。 
不 过 万 幸 的 是 , 大 部 分 应 用 程序 都 适用 于 分 代 式 垃圾 回收 , 而且 其 中 大 部 分 
对 象 在 其 生命 周期 内 都 只 对 创建 者 线程 可 见 。 





本 节 所 介绍 的 技术 可 谓 是 一 种 “赌博 式 ” 的 优化 ,这 种 优化 技术 广泛 应 用 于 自 适 应 运行 时 的 
各 个 领域 ， 如 果 赌 输 了 ， 后 果 很 严重 。 线 程 局 部 垃圾 回收 看 起 来 很 美好 ， 实 现 起 来 却 很 复杂 ， 目 
前 还 没 法 判断 它 是 否 可 用 于 生产 环境 中 。 











D 估计 是 做 对 象 提升 操作 。 一 一 译 者 注 
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2. 并 发 内 存 整 理 

线程 间 内 存 保护 另 一 个 发 展 方向 就 是 如 何以 较 少 的 同步 操作 来 执行 并 行 任务 , 例如 垃圾 回收 
器 执行 堆 内 存 整理 操作 。 堆 内 存 整理 的 开销 很 大 ， 因 为 对 象 的 引用 关系 可 能 会 跨越 整个 内 存 堆 。 
多 线程 执行 堆 内 存 整理 需要 在 线程 之 间 同 步 对 象 的 引用 关系 , 降低 了 任务 的 并 行 性 ,即使 将 堆 分 
化 成 几 个 分 区 , 各 个 分 区 由 不 同 的 线程 分 别处 理 , 也 还 是 需要 在 各 个 线程 之 间 同 步 对 象 的 引用 关 
系 ， 判断 不 同 线程 之 间 的 操作 是 否 会 相关 影响 。 

如 果 线 程 间 的 页 保护 机 制 能 完成 线程 间 同 步 检查 的 工作 ， 那 实现 并 发 堆 内 存 整 理 就 简单 多 
T, 还 能 提升 执行 性 能 。 当 正在 执行 整理 操作 的 线程 需要 与 其 他 线程 交互 时 ,可 以 通过 触发 页 错 
误 的 形式 来 完成 ， 而 无 须 在 垃圾 回收 器 中 显 式 处 理 ， 从 而 可 以 减少 整理 算法 中 的 同步 操作 。 
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本 音 主 要 介绍 了 JRockit VE 产品 及 其 背景 知识 , 包括 虚拟 化 和 虚拟 机 管理 程序 。 虚拟 化 是 指 
在 模拟 的 、 虚 拟 化 的 硬件 上 运行 软件 ,可 以 提升 硬件 资源 的 利用 率 , 但 模拟 硬件 来 实现 虚拟 化 也 
会 带 来 一 些 执行 开销 。 虚拟 化 的 软件 , 如 操作 系统 , 称 为 客户 应 用 程序 。 虚拟 化 主要 包含 两 大 类 ， 
即 全 虚拟 化 和 半 虚 拟 化 , 其 中 全 虚拟 化 指 客户 应 用 程序 不 做 任何 修改 就 能 在 虚拟 环境 中 运行 ,而 
半 虚 拟 化 是 指 客户 应 用 程序 需要 通过 显 式 的 中 间 层 来 与 底层 系统 交互 。 

虚拟 机 管理 程序 的 存在 使 多 个 客户 应 用 程序 可 以 同时 运行 于 一 台 物 理 机 器 上 , 它 会 模拟 物理 
硬件 , 在 客户 应 用 程序 之 间 做 上 下 文 切 换 , 还 会 提供 类 似 于 设备 驱动 程序 的 服务 供 客 户 应 用 程序 
使 用 。 虚拟 机 管理 程序 分 为 托管 型 和 本 地 型 两 类 , 其 中 托管 型 是 指 以 标准 操作 系统 形式 来 运行 虚 
拟 机 管理 程序 ， 而 本 地 型 是 指 将 虚拟 机 管理 程序 直接 安装 在 裸 设备 上 。 

在 JRockit VE 的 软件 栈 中 , 通用 操作 系统 层 被 移 除了 , 从 而 提升 了 整个 虚拟 系统 的 运行 性 能 。 
JRockit VE 与 通用 操作 系统 类 似 ， 但 只 会 运行 JVM 这 一 个 进程 ， 为 其 提供 必要 的 功能 支持 ， 因 
而 比 通用 操作 系统 简单 得 多 ， 既 小 巧 又 安全 。 

JRockit VE 自 带 的 Image Tool 工具 可 以 完成 虚拟 软件 的 离线 管理 任务 ， 而 在 线 管理 和 部 署 任 
务 则 交 由 具体 的 管理 框架 完成 ， 例 如 Oracle VM Manager。 

最 后 ， 本 章 介绍 了 如 何 改进 虚拟 化 的 Java 运行 环境 ， 当 然 前 提 是 可 以 完全 控制 虚拟 机 管理 
程序 和 Java 应 用 程序 之 间 的 中 间 地 带 。JRockit VE 的 长 期 发 展 目标 是 为 Java 应 用 程序 提供 比 物 
理 机 器 更 好 的 运行 环境 。 对 此 ， 开 发 团队 信心 十 足 。 
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术语 表 








安全 点 (safepoint) 

安全 点 是 指 Java 代码 中 可 以 使 Java 线程 暂停 的 地 方 。 安 全 点 中 包含 了 在 其 他 地 方 得 不 到 的 
信息 供 运 行 时 使 用 , 例如 在 寄存 器 中 包含 了 对 象 。 此 外 , 安全 点 还 可 以 保证 线程 上 下 文中 是 对 象 、 
内 部 指针 ， 或 者 不 是 对 象 ， 而 绝 不 会 是 中 间 状 态 。 

参见 活动 对 象 图 。 

半 虚 拟 化 〈paravirtualization ) 

半 虚 拟 化 是 指 ， 运 行 客户 应 用 程序 时 需要 通过 预定 义 的 API 与 底层 虚拟 机 管理 程序 交互 。 

参见 全 虚拟 化 和 虚拟 化 。 

保护 页 (guard page) 

保护 页 是 内 存 管理 中 的 一 个 特殊 页 ， 带 有 操作 系统 级 的 页 保护 标志 位 。 因 此 ， 对 该 页 做 解 引 
用 操作 时 ,会 抛 出 异常 。 这 个 特性 非常 有 用 ,将 保护 页 置 于 栈 结构 的 底部 时 ， 可 用 于 检查 是 否 发 
生 栈 溢出 。 此 外 , 还 可 以 用 保护 页 实现 安全 点 , 对 指定 安全 点 解 引 用 所 涉及 的 页 面 加 以 保护 即 可 。 
这 样 ， 当 下 一 次 到 达 安 全 点 时 ， 运 行 时 就 会 抛 出 一 个 异常 ， 终止 控 制 流 。 

参见 活动 对 象 图 和 安全 点 。 

保守 式 垃圾 回收 (conservative garbage collection) 

保守 式 垃 圾 回收 会 将 所 有 可 能 是 对 象 指 针 的 内 容 都 当 作 对 象 指针 来 处 理 , 这 样 就 不 需要 记录 
有 关 对 象 存活 的 元 信息 。 这 种 实现 方式 会 降低 垃圾 回收 的 执行 效率 ,因为 没有 元 信息 ,垃圾 回收 
器 就 不 得 不 做 一 些 额外 的 检查 。 例 如 ， 数 字 17 不 是 一 个 对 象 指针 ， 因 为 它 不 在 堆 空 间 内 ， 而 数 
F 0x471148 则 有 可 能 是 一 个 对 象 ( 如 果 它 在 堆 范围 内 的 话 ), 但 也 有 可 能 只 是 个 常量 值 。 如 果 某 
个 常量 碰巧 指向 了 堆 中 的 某 个 对 象 , 则 保守 式 垃圾 回收 很 有 可 能 会 把 这 个 常量 也 当 作 对 象 而 保留 
下 来 。 这 些 特 性 决定 了 保守 式 垃 圾 回收 在 移动 对 象 时 会 受到 很 大 的 限制 。 

参见 准确 式 垃圾 回收 、 活 动 对 象 图 和 安全 点 。 

本 地 代码 (native code) 

在 本 书 中 , 本 地 代码 、 汇 编 语言 和 机 器 代码 是 同一 个 意思 , 均 指 针对 于 指定 硬件 架构 的 专用 
语言 。 

本 地 内 存 (native memory) 

在 本 书 中 ， 本 地 内 存 是 指 由 运行 时 自身 ， 而 非 Java 堆 ， 使 用 的 部 分 内 存 。 这 部 分 内 存 可 用 
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作 代 码 缓冲 区 或 系统 内 存 〈 指 运行 时 为 其 内 部 数据 结构 分 配 内 存 时 ) 使 用 。 

参见 堆 。 

本 地 线程 〈native thread) 

本 地 线程 (有 时 又 称 为 操作 系统 线程 )， 是 由 专门 的 平台 或 操作 系统 提供 的 线程 实现 ， 例 如 
Linux 系统 中 的 POSIX 线程 。 

本 地 型 虚拟 机 管理 程序 (native hypervisor) 

本 地 型 虚拟 机 管理 程序 是 指 直 接 安 装 在 裸 硬件 上 的 虚拟 机 管理 程序 。 

参见 虚拟 机 管理 程序 。 

编辑 器 (editor) 
编辑 器 是 富 客户 端 平台 ( RCP ) 的 一 个 基本 概念 , 在 GUI 中 ， 它 通常 位 于 RCP 应 用 程序 的 
中 间 部 分 ， 展 示 相 关 数 据 。 

参见 富 客户 端 平台 。 

标记 -清理 (mark and sweep) 

标记 -清理 是 一 种 引用 跟踪 垃圾 回收 算法 ， 从 存活 对 象 出 发 ， 根 据 引 用 关系 追踪 其 他 存活 对 
象 ， 最 终 构成 存活 对 象 集合 。 在 遍历 所 有 引用 后 ， 清 除 所 有 已 知 的 非 存活 对 象 。 标 记 和 清理 工作 
可 以 多 线程 执行 来 提高 效率 。 目 前 来 看 ， 标 记 - 清 理 是 所 有 商用 JVM 中 垃圾 回收 器 的 基础 。 

参见 引用 追踪 垃圾 回收 。 

标签 组 (tab group) 

标签 组 是 JRockit Mission Control GUI 中 一 组 标签 的 集合 ， 按 功能 分 类 聚合 在 一 起 。 

参见 标签 组 工具 栏 。 

标签 组 工具 栏 (tab group toolkit) 

标签 组 工具 栏 位 于 JRockit Mission Control Console, JRA 和 JFR 编辑 器 左 侧 。 

参见 标签 组 。 

并 发 垃圾 回收 (concurrent garbage collection) 

本 书 中 , 并 发 垃圾 回收 是 指 在 垃圾 回收 周期 的 大 部 分 时 间 内 ，Java 应 用 程序 还 可 以 继续 执行 
的 垃圾 回收 算法 。 

参见 并 行 垃 圾 回收 。 

并 行 垃圾 回收 (parallel garbage collection) 

在 本 书 中 ,并 行 垃圾 回收 只 是 一 种 最 大 化 系统 吞吐 量 、 不 考虑 系统 延迟 的 垃圾 回收 策略 。 相 
对 于 以 低 延 迟 为 优化 目标 的 垃圾 回收 算法 来 说 , 并 行 垃圾 回收 所 使 用 的 算法 相对 简单 一 些 , 因此 
使 用 并 行 垃圾 回收 通常 会 导致 无 法 预测 的 应 用 程序 暂停 。 

参见 延迟 、 确 定式 垃圾 回收 和 并 发 垃圾 回收 。 

KE (sample) 

采样 是 指 以 预先 设计 好 的 时 间 间 隔 来 收集 相关 数据 。 自 适应 运行 时 的 基础 就 是 这 些 高 质量 的 
采样 数据 。 
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采样 分 析 (sample-based profiling) 

采样 分 析 是 指 根据 统计 学 原理 ,从 所 有 可 能 数据 或 采样 数据 中 , 抽取 出 一 部 分 数据 对 应 用 程 
序 分 析 。 如 果 抽 取得 正确 ， 可 以 节省 不 少 分 析 开 销 。 

参见 准确 分 析 。 

操作 集 (operative set) 

在 JRockit Mission Control 中 ， 操 作 集 是 一 个 用 户 定 义 的 事件 集合 ， 主 要 用 于 在 不 同 的 标签 
页 之 间 过 滤 搜 索 结 果 。 此 外 ， 操 作 集 还 可 配合 关联 键 来 查找 与 某 个 事件 属性 相关 联 的 事件 。 

参见 关联 键 。 

操作 系统 线程 (OS thread) 

参见 本 地 线程 。 

CAS (compare and swap) 

目前 很 多 CPU 架构 都 支持 原子 指令 ， 例 如 x86 平 台 的 cmpxchg 指令 和 SPARC 平台 的 cas 
指令 。 这 种 指令 会 比较 内 存 和 寄存 器 sch, 若 相 匹配 ， 则 用 预 设 的 某 个 值 来 覆盖 内 存 中 的 值 。 
WRAL TE IMD, 则 该 指令 会 设置 标志 寄存 器 , 做 分 支 处 理 使 用 。 该 指令 常用 于 高 效 地 实现 自 旋 锁 。 

参见 原子 指令 和 自 旋 锁 。 

插件 开发 环境 (plug-in development environment, PDE) 

PDE 是 Eclipse IDE 中 开发 Equinox 特性 查看 的 环境 ， 提 供 了 预定 义 的 模板 和 配置 ， 用 户 通 

这 些 预 定义 的 内 容 就 可 以 为 新 插件 生成 初始 内 容 ， 也 可 以 自 定义 新 的 模板 和 配置 。 

参见 扩展 点 。 

bat (constant pool) 


量 池 是 .class 文件 的 一 部 分 ， 其 中 存储 了 方法 所 用 到 的 常量 ， 如 字符 串 和 较 大 的 整数 。 


































































































JRA 
持续 型 JRA 表示 记录 任务 会 一 直 持 续 运 行 ， 是 早期 开发 JRA 时 的 概念 ， 后 来 了 下 A 被 JFR 所 
取代 。 


参见 JFR。 

抽象 语法 树 (abstract syntax tree，AST) 

抽象 语法 树 是 一 种 代码 表述 形式 ,如果 源 代码 结构 良好 ， 则 编译 器 前 端 可 以 根据 源 代 码 来 生 
成 AST。AST 中 的 每 个 节点 都 表示 高 级 语言 中 的 一 种 结构 ， 例 如 循环 或 赋值 。AST 本 身 的 节点 
不 能 出 现 循 环 结构 。 

Java 字 节 码 是 非 结 构 化 的 ， 其 表现 力也 强 于 Java 源 代码 ， 所 以 有 了 时候 无 法 通过 Java 字 节 码 
来 生成 AST, ltt, JRockit IR 是 以 图 而 非 树 的 形式 来 展现 的 。 

参见 中 间 表 示 。 

触发 器 动作 (trigger action) 

触发 需 动 作 是 JRockit Management Console 中 的 自 定 义 动 作 ， 当 满足 触发 需 规则 时 ， 会 调用 
该 动作 。 

参见 触发 器 规则 。 
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触发 器 规则 (trigger rule) 

触发 器 规则 是 Management Console 中 的 概念 ， 它 包含 了 触发 器 条 件 、 触 发 器 动作 和 可 选 的 
触发 器 约束 。 

参见 触发 器 条 件 、 触 发 器 动作 和 触发 器 约束 。 

触发 器 条 件 (trigger condition) 

触发 条 件 是 指 触发 器 规则 的 判断 条 件 ， 包 含 了 属性 值 和 具体 条 件 ， 例 如 “在 CPU 负载 已 经 
连续 2 分 钟 处 于 90% 时 ”触发 。 

参见 触发 器 规则 。 

触发 器 约束 (trigger constraint) 

触发 器 约束 指定 了 触发 器 规则 的 生效 时 间 ， 例 如 “只 在 早 8 点 到 晚 $ 点 之 间 生 效 ”。 

参见 触发 器 规则 。 

CPU 分 析 〈cpu profiling) 

CPU 分 析 是 JRockit Management Console 中 的 一 项 功能 ,可 以 显示 出 每 个 线程 的 CPU 使 用 情况 。 

存活 对 象 Clive object) 

存活 对 象 是 指 ， 从 根 集合 或 其 他 存活 对 象 出 发 ， 可 以 通过 引用 关系 追踪 到 的 对 象 。 “存活 
(live )” 和 “使 用 中 (in use )” 这 两 个 词 往往 可 以 交换 使 用 。 被 标记 为 存活 的 对 象 是 不 可 以 被 回 
收 掉 的 。 

参见 根 集合 。 

存活 集合 (live set) 

存活 集合 通常 是 指 那些 存活 对 象 所 占据 的 堆 空 间 。 

参见 存活 对 象 。 

存活 集合 + 碎片 化 (live set + fragmentation) 

实际 上 , 存活 集合 + 碎片 化 空间 就 是 堆 中 正在 使 用 的 内 存 空间 。 在 JRockit Mission Control 中 , 
这 块 空间 用 来 表示 运行 应 用 程序 所 需 的 最 小 内 存 空间 。 

4& (generation) 
代 是 堆 的 一 部 分 ， 通常 情况 下 ,对象 会 按 其 年 龄 (所 经 历 的 垃圾 回收 次 数 ) 存放 到 指定 的 
代 中 。 

参见 堆 和 分 代 式 垃圾 回收 。 

I (agent) 

本 书 中 的 代理 有 两 层 含义 , 分 别 是 JMX 代理 和 JFR 引擎 , 具体 是 哪个 需要 根据 语 境 来 判断 。 

参见 JMX FI JFR, 

代码 生成 队列 (code generation queue) 

代码 生成 队列 是 JRockit 中 的 一 个 专 有 和 名词 , 指 的 是 为 了 保证 Java 应 用 程序 的 持续 运行 ,JVM 
会 先 将 代码 生成 请 求 放 和 到 指定 队列 中 , 而 后 代码 生成 线程 会 从 该 队列 中 获取 任务 , 执行 代码 生 
成 任务 ,之 后 JVM 再 执行 新 生成 的 代码 。 

参见 优化 队列 。 
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大 内 存 页 (large page) 

大 内 存 页 是 所 有 现代 操作 系统 都 支持 的 一 种 机 制 , 即将 内 存 页 的 大 小 提升 为 MB 级 别 。 使 用 
大 内 存 页 可 以 加 速 转换 虚拟 地 址 的 速度 , 因为 可 以 降低 旁 路 转换 缓冲 ( translation lookaside buffer ) 
的 丢失 率 ; 坏处 是 大 幅 增加 了 内 存 页 的 大 小 ， 可 能 会 造成 本 地 内 存 的 碎片 化 。 

参见 本 地 内 存 。 

调用 分 析 (call profiling) 

调用 分 析 是 指 在 JIT 代码 中 注入 调用 计数 器 或 特定 代码 来 查看 方法 的 调用 频率 或 调用 路 径 。 
收集 到 的 调用 分 析 信 息 主要 用 于 代码 优化 ， 例 如 找 出 应 该 对 哪些 方法 做 内 联 处 理 。 

参见 自 适应 代码 生成 和 JIT 编译 。 

调用 计数 器 (invocation counter) 

调用 计数 器 是 一 种 用 来 检测 热点 代码 的 分 析 工 具 。 通常 情况 下 , 调用 计数 器 是 将 分 析 代 码 注 
人 到 方法 头 中 ,于 是 在 调用 目标 方法 时 会 先 将 调用 计数 器 加 1。 自 适应 运行 时 通常 会 扫描 调用 计 
数 器 , 并 对 那些 调用 次 数 达 到 了 效 值 的 方法 重新 优化 。 在 热点 检测 方面 ,调用 计数 需 的 粒度 还 略 
有 些 粗 放 ， 需 要 配合 其 他 检测 机 制 〈 例 如 线程 采样 ) 一 起 使 用 。 

参见 准确 分 析 和 线程 采样 。 

递归 加 锁 (recursive lock) 

在 Java 中 ， 人 允许 在 不 释放 监视 器 对 象 的 情况 下 ， 对 该 监视 器 做 重复 加 锁 的 操作 。 例 如 ， 某 
个 对 象 的 同步 方法 被 内 联 到 男 一 个 同步 方法 中 时 ， 就 出 现 了 递归 加 锁 。JVM 的 同步 机 制 必须 要 
能 够 正确 人 处理 这 种 情况 ， 记 录 加 锁 顺 序 ， 以 判断 加 锁 和 解锁 操作 是 否 是 配对 的 。 

参见 锁 配 对 和 和 锁 符号 。 

低级 中 间 表 示 (low level intermediate representation, LIR) 

LIR 位 于 Java 代码 在 JRockit 内 部 表示 中 的 最 底层 ， 它 包含 了 类 似 于 硬件 寄存 器 和 硬件 寻 址 
模式 等 结构 ， 并 且 可 能 会 包含 分 配 寄 存 器 的 内 容 。LIR 中 寄存 器 的 分 配 可 以 直接 映射 到 本 地 代码 
或 当前 CPU 架构 的 寄存 器 分 配 操作 。 

参见 高 级 中 间 表 示 、 寄 存 器 分 配 、 本 地 代码 和 中 间 表 示 。 

HE (heap) 

在 本 书 中 ， 堆 是 指 JVM 中 预 留 的 、 专 用 于 存储 Java 对 象 的 内 存 空间 。 

参见 本 地 堆 。 

对 象 池 (object pooling) 

对 象 池 是 为 了 避免 重复 内 存 分 配 所 带 来 的 执行 开销 而 提出 的 , 即 重用 已 有 的 对 象 , 而 不 是 每 
次 都 重复 创建 新 对 象 ， 就 具体 实现 来 说 ， 就 是 将 无 用 对 象 放置 到 对 象 池 中 ， 以 防止 其 被 回收 掉 。 
通常 来 说 , 使 用 对 和 象 池 并 不 是 个 好 主意 ,因为 它 会 扰乱 垃圾 回收 器 的 反馈 信息 ， 延 长 了 对 象 的 生 
命 周 期 。 

WRK (obejct header) 

在 JVM 中 ， 每 个 对 象 都 需要 使 用 些 元 数据 信息 ， 例 如 类 型 、 垃 圾 回收 状态 ， 以 及 是 否 被 加 
锁 等 。 这 些 信息 的 使 用 频率 很 高 ， 因 此 将 之 存储 在 对 和 象 本 身 的 头 部 ,通过 对 和 象 指针 来 引用 。 通 常 
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情况 下 ， 对 象 头 中 会 包含 锁 状 态 、 垃 圾 回收 状态 和 类 型 信息 。 

参见 锁 字 和 类 块 。 

多 对 多 线程 模型 (nxm thread) 

多 对 多 线程 模型 是 绿色 线程 的 变种 ,即使 用 多 个 本 地 线程 来 运行 多 个 绿色 线程 。 这 种 实现 方 
式 可 以 避免 绿色 线程 中 可 能 出 现 的 死 锁 和 IO 阻塞 的 问题 ， 但 在 现代 商用 JVM 中 ， 它 还 是 不 够 
完善 。 

参见 绿色 线程 。 

读 屏障 (read barrier) 

读 屏 障 是 指 编译 器 在 属性 域 载 人 代码 之 前 插入 的 一 小 段 代码 。 读 屏障 的 作用 之 一 就 是 执行 垃 
圾 回收 ， 以 便 检查 位 于 线程 局 部 区 域 (TLA ) 中 对 象 的 作用 域 是 否 已 经 超出 了 该 线程 ， 或 者 访问 
某 个 属性 域 的 线程 和 创建 该 对 象 的 线程 是 否 是 同一 个 线程 。 

参见 写 屏 障 。 

方法 垃圾 回收 (method garbage collection) 

在 本 书 中 , 方法 垃圾 回收 是 指 对 代码 的 垃圾 回收 , 即 从 代码 缓冲 区 中 清除 那些 不 再 使 用 的 本 
地 代码 ， 例 如 当 某 个 方法 被 重新 优化 或 重新 生成 后 ， 需 要 清除 之 前 的 无 用 代码 。 

访问 文件 〈access file) 

在 JMX 中 , 访问 文件 用 于 指定 不 同 角 色 的 访问 权限 。 一 般 情 况 下 , 该 文件 存放 于 JROCKIT_ 
HOME/jre/lib/management/jmxremote.accesso 

参见 密码 文件 和 JMX. 

非 连续 堆 (non-contiguous heap) 

非 连续 堆 是 指 将 几 块 并 不 相连 的 系统 内 存 作为 一 个 完整 的 Java 堆 使 用 。 由 于 内 存 块 并 不 连 
续 , 使 用 的 时 候 需要 做 些 额 外 的 记录 , 虽说 会 带 来 一 些 额外 的 开销 , 但 大 大 增加 了 可 用 的 堆 空 间 。 
由 于 32 位 系统 的 内 存 空间 有 限 ， 所 以 有 些 操作 系统 会 驻 留 在 内 存 空间 的 中 部 ， 有 了 非 连续 堆 的 
帮助 就 可 以 将 操作 系统 两 侧 的 内 存 空 间 都 利用 起 来 。 

分 代 式 垃圾 回收 (generational garbage collection) 

分 代 式 垃圾 回收 是 指 将 扒 划 分 为 多 个 区 域 ， 或 称 “ 代 "。 新 生 代 〈 即 young generation 或 nursery ) 
通常 比较 小 ， 执行 垃圾 回收 的 频率 较 高 ， 相 比 于 老年 代 来 说 ,垃圾 回收 的 执行 速度 也 较 快 。 当 系 
统 中 大 部 分 对 象 的 生命 周期 都 很 短 时 ,分 代 式 垃圾 回收 就 很 适用 。 不过, 分 代 式 垃圾 回收 也 会 带 
来 一 些 执行 开销 ， 垃 圾 回收 器 需要 记录 下 老年 代 中 哪些 对 象 包 含有 指向 新 生 代 对 象 的 引用 。 

参见 新 生 代 、 老 年 代 和 写 屏 障 。 

富 客 户 端 平 台 (rich client platform，RCP) 

使 用 Eclipse Equinox 技术 ( OSGi 在 Eclipse 中 实现 ) 和 SWT (Standard Widget Toolki )， 可 
以 借助 Eclipse 平 台 的 核心 来 构建 一 些 其 他 的 应 用 程序 ， 例 如 ，JRockit Mission Control 就 是 基于 
Eclipse RCP 实现 的 。 

服务 器 端 模 板 (server-side template) 

服务 器 端 模板 是 JSON 格式 的 文件 ， 用 于 控制 JFR 中 的 事件 设置 。 
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参见 事件 设置 和 客户 端 模板 。 

高 级 中 间 表 示 (high level intermediate representation, HIR) 

HIR 是 JRockit 中 将 字 节 码 转 换 为 本 地 代码 过 程 中 的 首 份 产 出 。JRockit HIR 是 一 个 以 基本 块 
作为 节点 的 有 向 控制 流 图， 每 个 基本 块 都 包含 0 个 或 多 个 操作 。JRockit HR 是 平台 无 关 的 。 

参见 中 级 中 间 表 示 、 低 级 中 间 表 示 、 中 间 表 示 、 寄 存 器 分 配 和 本 地 代码 。 

GC 策略 〈GC strategy) 

在 JRockit 垃圾 回收 器 中 ， 尤 其 是 R27 版 本 之 前 的 垃圾 回收 器 中 ，GC 策略 通常 是 指 符合 某 
种 启发 式 GC 规则 的 垃圾 回收 器 行为 。 在 JMAPI 中 ，GC 策略 包含 以 下 三 种 定义 : 
口 新 生 代 行为 ( 开 / 关 ) 
口 标记 阶段 行为 〈 并 行 /并 发 ) 
O 清理 阶段 行为 ( 并 行 /并 发 ) 

参见 启发 式 GC、 并 行 垃圾 回收 和 并 发 垃圾 回收 。 

GC 暂停 时 间 比 例 (GC pause ratio) 

GC 暂停 时 间 比 例 是 JRockit Mission Control 中 的 一 个 概念 ， 是 指 运 行 应 用 程序 代码 和 和 暂停 应 
用 程序 运行 垃圾 回收 代码 的 时 间 比 例 。 需 要 注意 的 是 ， 应 用 程序 运行 时 间 指 的 是 总 体 运 行 时 间 ， 
可 能 会 包含 将 数据 写 人 到 硬盘 的 延迟 时 间 。 

根 集 合 〈root set) 

引用 追踪 垃圾 回收 器 会 使 用 那些 从 一 开始 就 处 于 可 达 状 态 的 对 象 作为 初始 集合 ， 通 带 来 说 ， 
会 使 用 位 于 寄存 器 和 局 部 栈 帧 中 的 对 象 作 为 初始 集合 。 此 外 ， 根 集合 中 还 包含 了 一 些 全 局 数据 ， 
例如 静态 属性 域 中 的 变量 。 

参见 活动 对 象 和 引用 追踪 垃圾 回收 。 

公平 性 (fairness) 

若是 系统 中 的 线程 获得 时 间 片 的 概率 相同 ， 则 称 之 为 公平 调度 。 对 于 具体 的 应 用 程序 来 说 ， 
公平 调度 并 不 是 必需 的 , 因为 频繁 的 上 下 文 切 换 会 带 来 不 小 的 性 能 开销 , 不 过 在 需要 线程 能 够 均 
等 运行 的 场景 中 却 是 非常 重要 的 。 

KH (relational key) 

关联 键 是 与 事件 类 型 属性 相关 的 元 信息 , 将 不 同事 件 类 型 关联 起 来 。 关联 键 的 值 是 事件 类 型 
属性 ， 以 URI 的 格式 表示 ， 而 实际 属性 会 与 事件 配合 使 用 。 

过 度 供应 〈overprovisioning ) 

过 度 供应 是 指 ， 为 了 能 够 应 对 系统 峰值 ， 而 使 用 比 实际 所 需 更 多 的 硬件 来 部 署 应 用 程序 。 

合成 属性 (synthetic attribute) 

在 JMX F, 合成 属性 并 不 是 MBean 的 真实 属性 , 而 是 JRockit Mission Control 控 台中 的 一 个 
客户 端 结构 。 

参见 JMX 和 MBean。 

混合 模式 解释 执行 (mixed mode interpretation) 

混合 模式 解释 执行 是 指 以 字 节 码 解释 执行 的 方式 来 运行 大 部 分 代码 , 并 配 以 JIT 编译 对 热点 
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代码 做 动态 优化 。 

参见 字 节 码 解释 执行 、 字 节 码 和 JIT 编译 。 

混淆 (obfuscation) 

Java 代码 混 涌 是 有 意 对 字 节 码 的 修改 , 以 便 加 大 逆向 工程 的 难度 。 名 字 修 饰 ( name mangling ) 
并 不 损害 应 用 程序 的 性 能 ， 但 可 能 会 给 调试 程序 带 来 些 麻 烦 。 通 过 修改 控制 流 来 使 用 Java 中 不 
支持 的 结构 ， 可 能 会 扰乱 甚至 破坏 JIT 编译 器 或 优化 器 的 工作 ， 应 尽量 避免 。 

参见 名 字 修 饰 。 

存活 对 象 图 (livemap) 

存活 对 象 图 是 由 编译 右 生 成 的 元 数据 信息 , 记录 了 寄存 器 和 本 地 栈 帧 存储 的 对 象 信息 。 这 些 
言 息 对 于 执行 准确 式 垃 圾 回收 是 非常 有 用 的 。 

参见 准确 式 垃圾 回收 。 

活 锁 (livelock) 

活 锁 是 指 ， 两 个 线程 都 持 有 对 方 所 需要 的 资源 ， 同 时 又 都 在 主动 获取 对 方 的 资源 ， 这 时 两 个 
线程 均 处 于 活动 状态 ， 却 无 法 再 继续 执行 下 去 ， 只 会 不 断 尝试 获取 对 方 的 资源 。 活 锁 会 浪费 大 量 
的 CPU 资源 。 

参见 死 锁 。 

Java AFRA! (Java memory model, JMM) 

Java 是 一 种 平台 无 关 的 编程 语言 ， 因 此 需要 保证 同一 份 Java 代码 在 不 同 CPU 架构 上 也 能 具 
有 相同 的 行为 。 如 果 将 字 节 码 的 载 和 和 存储 操作 映射 到 本 地 代码 的 载 和 人 和 存储 操作 ， 则 Java 程 
序 可 能 会 在 不 同 的 CPU 架构 上 表现 出 不 同行 为 。 究 其 原因 ， 就 在 于 不 同 CPU 架构 之 间 可 能 使 用 
不 同 的 内 存 访问 模型 。 

为 了 保证 Java 程序 能 够 在 所 有 CPU 架构 上 具有 相同 的 内 存 操作 行为 , JMM 出 现 了 ,明确 规 
范 了 Java 中 的 内 存 访问 语义 。 在 Java 诞生 之 初 ，JMM 还 很 糟糕 ， 在 经 过 JSR-133 之 后 ， 终 于 实 
现 了 语义 的 一 致 性 。 

参见 JSR-133。 

Java Specification Request (JSR) 

对 Java 及 其 API 的 修改 是 以 一 种 半 公 开 的 方式 的 ， 称 为 JCP (Java community process ), “4 
需要 在 Java 标准 中 做 某 些 修改 时 ， 会 先 将 修改 内 容 写成 ISR 提交 给 ICP 进行 投票 。 众 所 周知 的 
例子 ， 如 JMM (JSR-133 ) 和 对 动态 语言 的 支持 ( JSR-292 )， 都 是 以 ISR 的 形式 提交 的 。 

Java 字 节 码 (Java bytecode) 

参见 字 节 码 。 

监视 器 (monitor) 

监视 器 是 一 个 对 象 , 可 用 于 执行 同步 操作 , 也 就 是 说 可 以 使 用 监视 右 来 限制 对 临界 区 的 排他 
性 访问 。 

参见 临界 区 。 
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基本 块 (basic block) 

在 编译 需 的 中 间 表 示 中 ， 基 本 块 是 最 小 的 控制 流 单元 。 一 般 情 况 下 ， 基 本 块 中 会 包含 0 个 或 
多 个 指令 ， 若 是 执行 了 基本 块 中 的 某 条 指令 ， 则 肯定 会 执行 该 基本 块 中 的 所 有 指令 。 

参见 控制 流 图 。 

寄存 器 分 配 (register allocation) 

寄存 器 分 配 是 指 ， 在 将 IR 转换 为 更 靠近 底层 平台 的 表示 形式 时 ， 所 涉及 的 将 硬件 寄存 器 分 
配给 虚拟 寄存 器 或 变量 的 过 程 。 一 般 来 说 , 硬件 寄存 器 的 数量 少 于 程序 中 变量 的 数量 ， 此 时 就 需 
要 通过 溢出 技术 将 一 些 变量 先 转 存 到 内 存 中 〈 通 党 是 用 户 栈 中 )。 由 于 需要 执行 一 些 变量 在 内 存 
和 寄存 器 中 的 换 入 换 出 操作 , 会 带 来 一 些 性 能 开销 。 优 化 寄存 器 分 配 算法 是 一 个 非常 重要 的 计算 
密集 型 的 问题 。 

参见 溢出 。 

记录 代理 (recording agent) 

参见 记录 引擎 。 

记录 引擎 (recording engine) 

记录 引擎 是 JFR 的 一 部 分 ,处理 IO 和 内 存 缓冲 区 等 事件 ， 提 供 了 控制 记录 任务 生命 周期 的 
API。 记 录 引 擎 也 被 称 为 记录 代理 。 

静态 编译 (static compilation) 

静态 编译 是 指 在 静态 环境 中 , 在 应 用 程序 运行 之 前 先 将 所 有 代码 都 编译 好 , 不 接收 运行 时 的 
反馈 信息 , 例如 C++。 静态 编译 的 优势 是 在 编译 时 可 以 对 整个 系统 代码 做 一 次 完整 的 分 析 , 而 且 
编译 后 程序 在 运行 时 不 会 发 生变 化 ， 虽 说 编译 时 间 会 长 一 点 ,不 过 不 影响 运行 时 间 。 相 应 地 ， 静 
态 编译 的 缺点 是 ， 无 法 根据 运行 时 的 反馈 信息 来 动态 调整 优化 策略 和 程序 行为 。 

参见 预 编译 、 自 适应 代码 生成 和 JIT 编译 。 

静态 单 赋值 形式 (static single assignment form, SSA form) 

静态 单 赋值 形式 是 一 种 对 中 间 代 码 的 转换 ,使 每 个 变量 仅 被 赋值 一 次 。 经 过 这 种 转换 后 ， 可 
以 简化 其 他 优化 手段 和 数据 流 分 析 。 静态 单 赋 值 形式 定义 了 一 个 连接 操作 符 @, 用 于 连接 任意 多 
的 来 源 变量 和 目标 ， 其 中 对 目标 的 含义 是 “任意 一 个 源 变 量 ”"。 由 于 操作 符 @ 不 能 用 本 地 代码 来 
表示 ， 在 发 射 代码 (code emission) 之 前 ， 需 要 再 将 SSA 形式 转换 回 普通 代码 形式 。 

JIT 编译 (just-in-time compilation, JIT compilation) 

JIT 编译 ， 也 叫 即时 编译 ， 是 指 在 首次 调用 某 个 方法 之 前 ， 先 将 之 编译 为 本 地 代码 的 过 程 。 

参见 静态 编译 和 预 编 译 。 

基准 测试 驱动 程序 (benchmark driver) 

基准 测试 驱动 程序 是 指 在 基准 测试 中 通过 一 台 或 多 台 机 器 来 增加 负载 , 然后 在 衡量 基准 测试 
目标 操作 的 实际 执行 时 间 时 ， 再 将 这 部 分 工作 时 间 排 除 在 外 的 测试 方式 。 

JMAPI 

JMAPI (JRockit management API ) 是 一 套 私 有 的 JVM 管理 API， 用 于 监控 JVM 运行 状态 ， 
并 允许 在 运行 过 程 中 修改 JVM 的 行为 。 在 业界 标准 出 现 之 前 , 这 套 API 首 先 给 出 了 对 JVM 做 监 
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控 和 动态 调整 的 解决 方案 。 在 JRockit R28 版 本 中 ，JMAPI 的 部 分 内 容 已 经 被 废弃 掉 ， 转 而 通过 
JMXMAPI 来 完成 相应 的 功能 。 

参见 JMXMAPI。 

JMX 

JMX (Java management extensions ) 是 一 套 对 Java 应 用 程序 监控 和 管理 的 标准 接口 。 

参见 MBean, 

JMXMAPI 

JSR-174 为 JVM 引 入 了 基于 JMX 的 标准 管理 API，JMXMAPI 则 是 JRockit 对 JSR-174 的 扩 
展 实现 .JMXMAPI 中 包含 的 MBean 暴露 出 了 JRockit 的 专属 行为 ,可 以 在 JRockit Mission Control 
中 调用 相关 操作 ， 读 写 相 关 属 性 。 在 JRockit 中 ，JMXMAPI 是 在 JRockit R27 版 本 中 出 现 的 ， 但 
到 目前 为 止 还 没有 得 到 官方 支持 ， 将 来 的 版 本 中 可 能 会 发 生变 化 。 

参见 JMX、JSR-174 和 MBean。 

JRCMD 

JRCMD ( JRockit CoManD ) 是 一 个 随 JRockit 运行 时 一 同 发 行 的 命令 工具 ， 可 以 向 运行 在 本 
地 的 JRockit 实例 发 送 诊断 命令 。 安 装 JRockit 运行 时 后 ， 可 以 在 JROCKIT_HOME/bin 目录 下 找 
到 JRCMD ( JRockit CoMmanD )。 

JRockit 

实际 上 ，JRockit 是 一 组 技术 的 统称 ， 其 主旨 是 为 了 提升 Java 应 用 程序 的 性 能 和 可 管理 性 。 
JRockit 技术 组 主要 包括 了 JRockit Virtual Edition, JRockit Real Time, JRockit Mission Control 和 
旗舰 产品 TRockit JVM. 

JRockit Flight Recorder (JFR) 

在 JRockit R28/JRockit Mission Control 4.0 及 其 之 后 的 版 本 中 ，JFR 成 为 了 性 能 分 析 和 问题 诊 
断 的 主力 工具 。JFR 可 以 在 内 存 和 硬盘 中 持续 记录 JVM 的 运行 时 数据 。 

JRockit Memory Leak Detector (Memleak) 

JRockit Memory Leak Detector ( 也 称 为 Memleak ) 是 JRockit Mission Control 套件 中 的 内 存 泄 
漏 检 测 工 具 ， 用 于 检测 是 否 存 在 内 存 泄漏 以 及 具体 形成 原因 ， 还 可 用 于 获取 一 些 堆 分 析 信 息 。 

JRockit Mission Control (JRMC) 

JRockit Mission Control 是 JRockit 中 一 组 管理 工具 套件 ， 可 用 于 管理 、 监 控 、 分 析 运 行 在 
JRockit JVM 中 的 应 用 程序 ， 还 可 以 用 来 追踪 应 用 程序 的 内 存 汇 漏 问题 。 

参见 JRockit Memory Leak Detector, JRockit Runtime Analyzer 和 JRockit Flight Recorder. 

JRockit Runtime Analyzer (JRA) 

JRockit Runtime Analyzer (JRA ) 是 JRockit R27 及 其 之 前 版 本 中 的 主力 分 析 工 具 。 到 R27.3 
版 本 时 , JRA 中 新 增 了 一 个 强大 的 延迟 分 析 器 , 对 于 查看 应 用 程序 空闲 原因 非常 有 用 。 在 JRockit 
R28 版 本 中 ，JRA 被 JFR 所 取代 。 

参见 JRockit Flight Recorder。 
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JSR-133 

JSR-133 旨 在 解决 因 CPU 架构 不 同 而 可 能 导致 的 Java 应 用 程序 行为 不 一 致 的 问题 。 

参见 ISR All IMM. 

JSR-174 

JSR-174 用 于 改进 和 标准 化 Java 运行 时 的 监控 和 管理 特性 。JSR-174 带 来 了 java.lang. 
management 包 和 平台 MBean 服务 器 的 概念 。 从 Java 5.0 起 ，JSR-174 得 到 了 完整 实现 。 

参见 ISR 和 MBean 服务 器 。 








JSR-292 

JSR-292 旨 在 通过 修改 Java 语言 和 字 节 码 规范 来 使 JVM 可 以 支持 动态 语言 ， 例 如 Ruby. 
参见 JSR。 

角色 (role) 


在 MX 中 ， 作 为 安全 框架 的 一 部 分 ， 角 色 用 于 控制 远程 访问 和 管理 的 安全 性 。 角 色 是 与 相 
应 的 访问 权限 相关 联 的 。 为 了 保证 有 效 性 ， 角 色 必 须 同 时 存在 于 密码 文件 和 访问 文件 中 才 行 。 

参见 JMX、 密 码 文件 和 访问 文件 。 

JVM 浏览 器 (JVM browser) 

JVM ii Witt JRockit Mission Control 中 的 一 个 树 形 视 图 ， 用 于 展示 JRockit Mission Control 
可 以 连接 到 的 JVM 实例 。 

参见 JRockit Mission Control, 

+ (card) 

EREBP, 卡 是 一 种 数据 结构 ， 用 于 表示 某 块 堆 内 存 。 整 个 堆 内 存 被 划分 为 多 个 卡 , 存储 于 
卡 表 中 。 在 分 代 式 垃圾 回收 中 ， 卡 表 用 于 判断 老年 代 指定 分 区 是 否 是 脏 的 (dirty )， 即 该 区 域 中 
是 否 有 对 象 包含 有 指向 新 生 代 中 对 象 的 引用 。 

参见 写 屏 障 和 分 代 式 垃圾 回收 。 

+ (card table) 

参见 卡 。 

开 箱 即 用 (out of the box behavior) 

对 于 自 适 应 运行 时 来 说 , 应 该 是 不 需要 做 任何 额外 的 配置 就 可 以 顺畅 运行 的 , 然后 无 须 用 户 
参与 ， 根 据 运 行 时 的 反馈 信息 做 调整 运行 时 的 行为 ， 优 化 堆 的 大 小 ， 从 而 达到 稳定 的 运行 状态 。 
但 现实 是 残酷 的 ， 这 种 好 事 并 不 多 ， 因 此 如 何 做 到 开 箱 即 用 是 一 个 很 热门 的 研究 课题 。 

客户 端 模 板 (client-side template) 

JRockit Mission Control 的 客户 端 模板 用 于 控制 运行 时 记录 的 事件 设置 。 解 析 该 模板 文件 时 ， 
采用 全 解析 策略 ， 即 不 支持 通配符 。 模 板 文件 可 以 带 有 版 本 信息 。 

参见 事件 设置 和 服务 器 端 模 板 。 

客户 应 用 程序 (guest) 

运行 在 虚拟 机 管理 程序 上 的 自 包 含 的 系统 , 例如 操作 系统 ,被 称 为 客户 应 用 程序 。 多 个 客户 
应 用 程序 可 以 运行 在 同一 个 虚拟 机 管理 程序 中 ,只 不 过 在 全 虚拟 化 下 , 客户 应 用 程序 会 认为 自己 
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直接 运行 在 物理 机 器 上 ， 并 不 会 意识 到 有 其 他 客户 应 用 程序 存在 。 
参见 虚拟 化 和 虚拟 机 管理 程序 。 
空闲 列表 (free list) 








faa 























空闲 列表 是 运行 时 用 来 记录 堆 中 可 用 空间 的 数据 结构 。 通 常情 况 下 , 空闲 列表 会 指向 堆 中 那 
些 可 以 容纳 新 对 象 的 空洞 , 其 具体 结构 可 能 是 针对 固定 大 小 区 域 块 的 优先 级 队列 。 在 为 对 象 分 配 
内 存 时 ， 会 在 对 应 大 小 的 空闲 列表 中 查找 合适 的 空闲 块 。 

参见 碎片 化 。 


控制 流 图 (control flow graph, CFG) 

控制 流 图 是 一 种 程序 表示 方式 , 它 以 图 的 形式 展示 了 程序 可 能 具有 的 执行 路 径 (通常 会 以 基 
本 块 作为 节点 )。 图 中 节点 之 间 的 边 可 以 表示 直接 跳 转 (如 goto )、 条 件 跳 转 、 分 支 跳 转 等 。 

参见 基本 块 。 

扩展 点 (extension point) 

在 Eclipse Equinox( OSGi ) 中 ,插件 可 以 通过 扩展 点 为 应 用 程序 增加 新 功能 ,例如 , 在 JRockit 
Management Console F, 第 三 方 插件 可 以 通过 扩展 点 来 增加 新 的 标签 页 。 基 于 扩展 点 实现 的 功能 
组 件 称 为 扩展 插件 。 

老年 代 (old space) 

在 分 代 式 垃圾 回收 中 ,对 象 在 经 历 过 几 轮 垃圾 回收 后 , 会 被 移出 新 生 代 ,统一 存放 到 另 一 个 
地 方 ， 即 老年 代 。 

类 块 (class block) 

类 块 是 JRockit 中 的 名 词 ， 指 对 象 头 中 所 指向 的 、 包 含 了 类 型 信息 的 数据 块 。 

参见 对 象 头 。 

类 垃圾 回收 (class garbage collection) 

类 垃圾 回收 是 指 JVM 对 运行 时 中 的 类 信息 进行 清理 。 如 果 某 个 类 已 经 被 卸载 了 ， 而 且 没有 
java.lang.ClassLoader 实例 或 其 他 代码 引用 该 类 或 其 方法 时 ， 就 可 以 将 其 清理 掉 了 。 

临界 区 (critical section) 

临界 区 是 指 一 次 只 能 被 一 个 线程 执行 的 代码 片段 。 在 实现 临界 区 的 时 候 , 一 般 会 使 用 锁 来 锁 
住 临界 区 的 整 块 代码 (例如 synchronized 代码 块 )。 

绿色 线程 (green thread) 

绿色 线程 是 指 用 一 个 底层 线程 实例 ( 例如 一 个 操作 系统 线程 ) 来 表示 多 个 高 层 线程 实例 ( 例 
如 java.lang. Thread 对 象 ), 对 于 没什么 复杂 性 的 应 用 程序 来 说 , 这 个 实现 方式 简单 有 效 , 但 
也 存在 次 端 ， 最 大 的 问题 就 是 多 线程 处 理 。 在 本 地 代码 中 ， 无 法 对 线程 施加 控制 , 没 法 得 知 线程 
正在 等 待 /JO， 因 此 可 能 会 出 现 死 锁 的 情况 。 如 果 将 绿色 线程 置 于 休眠 状态 ， 通 常会 将 其 底层 的 
操作 系统 线程 也 一 起 休眠 ， 导 致 该 操作 系统 线程 所 代理 的 其 他 绿色 线程 都 无 法 运行 。 

参见 多 对 多 线程 模型 。 

MBean 

MBean 是 JMX 规范 中 设备 层 的 一 部 分 ,一 个 MBean 实例 是 一 个 托管 的 Java 对 象 ， 表 示 对 
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某 种 资源 的 管理 ， 可 以 读 写 的 属性 ， 可 以 被 调用 的 操作 ， 以 及 可 以 发 出 通知 。 

更 多 详细 信息 请 参见 JSE 中 MBean 部 分 的 文档 ，http://java.sun.com/j2se/1.5.0/docs/guide/ 
management/overview.html#mbeans o 

MBean 服务 器 

MBean 服 务 器 是 JMX 架 构 的 核心 组 件 , 用 于 管理 MBean 的 生命 周期 ,并 通过 连接 器 将 MBean 
暴露 给 消费 者 。 

参见 JMX 和 MBean. 

MD5 

一 种 哈 希 算法 。 

密码 文件 (password file) 

在 JMX 中 ， 密 码 文 件 记 录 了 不 同 角 色 的 定义 和 对 应 的 密码 。 一 般 来 说 ， 该 文件 会 放置 于 
JROCKIT_HOME/jre/lib/management/jmxremote.password o 

参见 访问 文件 。 

名 字 修 饰 (name mangling) 

名 字 修 饰 是 一 种 字 节 码 混淆 技术 , 是 指 为 了 防止 反 编 译 代 码 , 将 编译 后 的 代码 中 的 方法 和 属 
性 域 的 名 字 都 蔡 换 为 自动 生成 的 、 无 意义 的 名 字 。 

参见 混淆 。 

密 钥 库 (keystore) 

密 钥 库 用 于 保存 公 钥 和 私 钥 ， 使 用 密码 来 保证 口令 的 安全 性 。 

参见 信任 库 。 

内 部 指针 (internal pointer) 

在 本 书 中 ， 内 部 指针 是 指 带 有 偏 移 的 Java 对 象 引 用 ， 这 样 就 可 以 直接 指向 对 象 本 身 ， 而 不 
是 位 于 对 象 地 址 开始 处 的 对 象 头 。 尽 管 垃圾 回收 器 需要 对 内 部 指针 做 特殊 处 理 , 但 内 部 指针 对 于 
生成 高 性 能 代码 确实 非常 重要 的 ， 例 如 实现 数组 遍历 时 ， 直 接 使 用 对 象 原始 地 址 是 很 不 方便 的 。 
此 外 ， 对 于 某 些 有 限 寻 址 模式 的 平台 (例如 IA-64 ) 来 说 ， 使 用 内 部 指针 是 必须 的 。 

内 存 分 配 分 析 (allocation profiling) 

JRockit Management Console 的 一 个 特性 就 是 允许 用 户 实时 查看 应 用 程序 中 各 个 线程 的 内 存 分 
配 情况 。JFR 中 划分 了 多 种 内 存 分 配 分 析 事 件 , 用 户 可 以 查看 每 个 线程 中 每 种 事件 类 型 的 统计 数据 。 

内 存 整理 (compaction ) 

内 存 整理 可 用 于 降低 堆 的 碎片 化 程度 。 经 过 内 存 整理 后 ， 对 象 会 被 移动 到 一 起 ,形成 一 块 大 
的 “存活 区 域 ”， 消 除 内 存 碎片 。 对 整个 堆 做 内 存 整理 操作 ， 往 往 需要 和 暂停 应 用 程序 线程 。 

参见 碎片 化 。 

ARK (inline) 

内 联 是 一 种 代码 优化 手段 , 通过 将 被 调用 函数 的 代码 复制 到 调用 函数 中 , 节省 函数 调用 所 带 
来 的 开销 。 做 得 好 的 话 ， 威 力 强 大 ; 但 如 果 过 度 优化 ,或 者 函数 调用 频率 太 低 ， 则 可 能 会 带 来 诸 
如 指令 缓存 失效 等 问题 。 
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NUMA 架构 
NUMA, ， 即 非 一 致 性 内 存 架 构 ， 是 一 个 相对 较 新 的 概念 。 为 了 能 够 节省 总 线 带宽 ，NUMA 














将 多 个 CPU 划分 为 几 组 ， 并 配 以 专门 的 内 存 空间 。 不 同属 组 之 间 以 总 线 相连 ， 因 此 CPU 对 自己 





战 ， 





适 月 











属 组 的 内 存 操作 的 速度 快 于 操作 其 他 属 组 的 内 存 。NUMA 的 出 现 是 对 自 适应 内 存 管理 的 一 大 挑 





为 无 法 预测 对 象 会 位 于 哪 一 组 内 存 中 。 
胖 锁 (fat lock) 
相对 于 瘦 锁 ， 胖 锁 更 加 智能 ， 实 现 也 更 加 复杂 。 当 线程 在 等 待 获取 锁 的 时 候 ， 胖 锁 会 将 线程 





置 于 休眠 状态 ， 并 为 等 待 线程 维护 一 个 优先 级 队列 。 胖 锁 可 以 降低 对 CPU 资源 的 消耗 ， 所 以 更 


于 那些 竞争 激烈 或 持 有 时 间 很 长 的 锁 。 

参见 瘦 锁 。 

膨胀 驱动 程序 (balloon driver) 

在 虚拟 环境 中 ， 虚 拟 机 管理 程序 有 时 可 以 使 用 名 为 “膨胀 驱动 程序 ”( 其 具体 形式 是 虚拟 设 























备 驱动 程序 ) 的 机 制 来 隐 式 地 与 客户 应 用 程序 沟通 内 存 使 用 情况 。 通过 这 种 机 制 , 客户 应 用 程序 
对 内 存 的 使 用 请 求 就 可 以 跨越 虚拟 抽象 层 这 道 屏障 ， 实 现 内 存 使 用 的 动态 伸缩 。 























参见 虚拟 化 、 客 户 应 用 程序 和 虚拟 机 管理 程序 。 

偏向 锁 (biased locking) 

参见 延迟 解锁 。 

强 引用 (strong reference) 

强 引 用 是 Java 中 的 标准 引用 形式 ， 默 认 情 况 下 就 是 强 引用 ， 所 谓 强 引用 ， 其 实 只 是 相对 于 





软 引 用 和 弱 引 用 来 说 的 。 


上 一 样 。 


参见 软 引 用 。 

启发 式 垃圾 回收 (GC heuristic) 

启发 式 垃圾 回收 是 指 一 组 规则 ,例如 规定 吞吐 量 和 和 暂停 时 间 , 用 于 确定 如 何 配置 垃圾 回收 器 。 
参见 GC 策略。 

全 虚拟 化 full virtualization) 

全 虚拟 化 是 指 客 户 应 用 程序 无 须 任何 修改 就 可 以 直接 运行 在 虚拟 机 中 , 就 像 运行 在 物理 硬件 
































参见 虚拟 化 和 客户 应 用 程序 。 

驱动 程序 (driver) 

参见 基准 测试 驱动 程序 。 

确定 式 垃 圾 回收 (deterministic garbage collection) 

在 本 书 中 ， 确 定式 垃圾 回收 是 指 JRockit Real Time 所 使 用 的 低 延 迟 垃圾 回收 器 。 

参见 延迟 和 软 实 时 。 

热身 (warm up) 

做 基准 测试 时 ， 需 要 在 进行 主 测试 之 前 ， 先 执行 一 些小 规模 测试 ， 以 便 使 和 月 适应 运行 时 达到 相 

















对 稳定 的 运行 状态 , 剔除 系统 稳定 波动 而 带 来 的 误差 。 在 热身 结束 后 ,就 可 以 正式 开始 做 主 测试 了 。 
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向 前 滚动 (rollforwarding) 
向 前 滚动 是 指 ， 在 老 版 本 的 JRockit 中 ， 通 过 模拟 接 下 来 的 几 个 指令 将 暂停 住 的 应 用 程序 线 








程 带 入 到 安全 点 ， 改 变 该 线程 的 上 下 文 。 


参见 活动 对 象 和 安全 点 。 
软 实时 (soft real-time) 
软 实时 是 指 需要 对 系统 延迟 做 某 种 程度 控制 的 环境 ， 此 外 ， 虽 说 需要 控制 延迟 ， 却 不 需要 严 








格 控制 每 次 暂停 的 时 间 边 界 . 通 常情 况 下 , 软 实时 会 涉及 根据 延迟 来 指定 服务 等 级 的 质量 .JRockit 
Real Time 的 垃圾 回收 需 所 支持 的 确定 式 垃 圾 回收 就 是 软 实时 的 实现 。 























参见 硬 实 时 。 
软 引用 (soft reference) 
软 引 用 是 一 些 垃圾 回收 器 需要 特殊 对 待 的 对 象 类 型 。Java 中 共有 4 种 类 型 引用 , 分 别 是 强 引 























用 (strong reference )、 软 引用 ( soft reference )、 弱 引用 (weak reference ) 和 虚 引 用 (phantom 


reference )。 当 内 存 不 足 时 ， 垃 圾 回收 器 可 以 回收 掉 软 引用 和 弱 引 用 所 包装 的 对 象 ( 通常 来 说 ， 
包装 对 象 是 一 个 Reference 类 的 实例 )。 虚 引 用 是 个 很 特殊 的 存在 , 它 所 包装 的 对 象 是 无 法 被 获 
取 到 的 ， 其 功能 在 于 实现 更 安全 的 “ 析 构 函数 ”。 


的 ， 














软件 预 抓 取 (software prefetching) 
软件 预 抓 取 是 指 在 代码 通过 显 式 预 抓 取 指 令 来 实现 的 预 抓 取 。 

参见 硬件 预 抓 取 和 预 抓 取 。 

弱 引 用 (weak reference) 

参见 软 引 用 。 

死 代 码 (dead code) 

死 代码 是 指 应 用 程序 中 永远 也 不 会 被 执行 的 代码 。 如 果 编 译 器 能 证 明 某 段 代码 确实 是 死 代 















































， 则 通常 会 将 其 删除 。 


死 锁 (deadlock) 

死 锁 是 指 两 个 线程 都 因 等 待 对 方 释放 自己 需要 的 资源 而 被 阻塞 住 。 相 关 线程 自己 是 无 法 解锁 
只 能 永远 等 下 去 。 虽 然 死 锁 是 很 严重 的 问题 , 但 至 少 当 涉及 的 锁 为 胖 锁 时 , 不 消耗 CPU 资源 。 
参见 胖 锁 和 活 锁 。 

死 锁 检 测 (deadlock detection) 

死 锁 检 测 是 JRockit Management Console 的 一 项 功能 , 用 于 检测 系统 中 是 否 存 在 死 锁 的 线程 。 
参见 死 锁 。 

设计 模式 (design mode) 

在 运行 JFR 客户 端 时 , 设计 模式 是 禁用 的 。 通过 设计 模式 可 以 直接 访问 构建 用 户 界面 的 各 种 















































TH, HEX GUI 界面， 并 将 之 导出 为 插件 供 他 人 使 用 。 


参见 运行 模式 。 
生成 器 (producer) 
在 JFR 中， 生成 右 (或 称 事件 生成 器 ) 是 指 为 事件 提供 命名 空间 和 类 型 定义 的 实体 。 
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参见 事件 和 事件 类 型 
事件 (event) 


























在 JRA 延迟 分 析 工 具 和 JFR F, 事件 是 与 某 个 时 间 点 相关 的 数据 集合 。 事 件 可 以 有 持续 时 








间 属 性 和 事件 类 oki 
参见 事件 类 
事件 类 型 ae type) 








事件 类 型 用 于 描述 JFR 中 的 事件 , 包含 了 与 不 同事 件 域 相关 的 信息 ,以 及 事件 路 径 、 事 




















和 描述 等 元 信息 。 事 件 类 型 和 事件 的 关系 就 好 像 是 类 和 实例 的 关系 。 
事件 设置 (event setting) 
事件 设置 包括 要 记录 的 事件 类 型 、 阔 值 等 属性 ， 以 及 是 否 记录 调用 栈 和 线程 信息 。 
参见 客户 端 模板 和 服务 器 端 模板 。 
事件 属性 (event attribute) 
一 个 事件 包含 了 若干 命名 值 ， 这 些 命 名 值 称 为 属性 。 
参见 事件 。 
事件 域 (event field) 
参见 事件 属性 。 
实时 (real time) 
在 本 书 中 ， 实 时 是 指 运 行 时 环境 中 需要 控制 系统 延迟 的 场景 ， 例 如 软 实时 。 
参见 软 实时 和 硬 实时 。 
Æi (thin lock) 



































lig 


有 件 属性 也 称 为 事件 域 。 




















件 名 


瘦 锁 是 一 种 简单 小 巧 的 锁 实现 , 适用 于 苋 争 不 激烈 和 持 锁 事件 不 长 的 场景 , 通常 用 于 实现 自 





旋 锁 。 
参见 胖 锁 和 自 旋 锁 。 
双 检 查 锁 (double-checked locking) 

















双 检 查 锁 是 指 在 获取 锁 之 前 先 以 不 安全 的 方式 检查 锁 是 否 满足 条 件 , 以 期 避免 执行 开销 











较 大 


的 加 锁 操 作 。 强 烈 建议 不 要 使 用 这 种 “技巧 ”， 因 为 在 某 些 内 存 模型 下 ， 这 种 技巧 可 能 具有 不 同 























的 行为 ， 甚 至 是 错误 的 行为 。 
参见 Java 内 存 模 型 。 
Stopping-the-world (STW) 


STW 是 指 暂 停 应 用 程序 中 的 线程 ， 以 便 运 行 时 完成 一 些 内 部 工作 ,例如 运行 时 执行 非 并 发 











垃圾 回收 。STW 是 造成 系统 延迟 的 主要 原因 ( 当然 还 有 其 他 原因 ， 例 如 等 待 IO )。 
参见 延迟 。 
碎片 化 (fragmentation) 














碎片 化 是 内 存 分 配 行为 和 可 分 配 内 存 的 恶化 , 其 成 因 是 对 象 被 垃圾 回收 顺 回 收 后 在 内 存 空 四 
中 留 下 无 法 再 被 使 用 的 空洞 。 如 果 堆 中 的 空洞 非常 多 ,而 又 非常 小 ,此 时 即便 空闲 内 存 不 少 ， 
有 可 能 无 法 再 为 新 对 象 分 配 内 存 了 。 碎片 化 是 现代 垃圾 回收 器 的 天 敌 之 一 ,不 cual aes 
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内 存 整理 来 解决 碎片 化 问题 。 

参见 内 存 整 理 。 

锁 符号 (lock token) 

锁 符 号 是 作为 唯一 标识 某 对 加 锁 和 解锁 操作 的 记号 , 锁 配 对 操作 通过 该 符号 来 判断 加 锁 和 解 
锁 是 否 相 匹 配 。 一 般 情 况 下 ， 锁 符号 总 包含 了 指向 Java 监视 器 对 象 的 对 象 指针 ， 并 使 用 一 些 标 
记 位 来 记录 当前 的 加 锁 情 况 , 如 当前 是 胖 还 是 瘦 锁 ， 是 和 否 是 递归 加 锁 等 。 如 果 代 码 生成 器 无 法 找 
到 相 匹 配 的 加 锁 和 解锁 操作 ， 则 会 将 锁 符 号 标记 为 “未 匹配 的 ”， 这 种 情况 下 虽说 比较 少见 ， 但 
确实 是 可 能 存在 的 , 因为 字 节 码 的 表达 本 就 更 加 自由 。 当然 , 相 比 于 正常 的 匹配 的 锁 符号 来 说 ， 
未 匹配 的 锁 符 号 在 执行 同步 操作 时 ， 效 率 更 低 一 些 。 

参见 锁 配 对 。 

tifex} (lock pairing) 
虽然 在 Java 源 代码 中 ， 加 锁 和 解锁 操作 是 自动 配对 的 , 但 在 Java 字 节 码 中 , 指令 monitorenter 
All monitorexit 并 不 是 自动 配对 的 。 因 此 为 了 支持 某 些 锁 操 作 ， 如 延迟 解锁 和 递归 加 锁 ， 代 码 
生成 器 需要 能 够 自行 将 加 锁 和 解锁 操作 配对 ,这 里 就 涉及 了 一 个 名 为 “ 锁 符 号 ”的 结构 ,代码 生 
成 融通 过 该 锁 符 号 来 判断 加 锁 和 解锁 是 否 相 匹配 。 

参见 延迟 解锁 、 递 归 加 锁 和 锁 符号 。 

锁 膨 胀 〈lock inflation) 

锁 膨 胀 是 指 ,， 根据 运行 时 的 反馈 信息 ,动态 地 将 瘦 锁 升级 为 胖 锁 。 一 般 情 况 下 ,执行 锁 膨胀 
是 因为 对 目标 锁 的 竞争 已 经 由 竞争 不 激烈 变 为 竞争 激烈 了 。 

参见 锁 收 缩 、 胖 锁 和 疫 锁 。 

锁 融 合 (lock fusion) 

锁 融 合 是 指 , 将 两 个 需要 加 锁 或 解锁 操作 的 区 域 融合 ,使 用 一 个 锁 来 管理 。 知 是 两 个 被 监视 
器 管理 的 代码 块 之 间 只 是 一 些小 量 的 、 无 副作用 的 代码 , 则 可 以 通过 锁 融 合 来 剔除 不 必要 的 解锁 、 
加 锁 操 作 ， 提 升 系统 的 整体 性 能 。 

参见 延迟 解锁 。 

锁 收 缩 Clock deflation) 

锁 收 缩 是 指 ， 根据 运 行 时 的 反馈 信息 ,动态 地 将 胖 锁 转 换 为 瘦 锁 。 一 般 情 况 下 ,执行 锁 收 缩 
是 因为 对 目标 锁 的 竞争 已 经 由 竞争 激烈 变 为 不 激烈 了 。 

参见 锁 膨 胀 、 胖 锁 和 疫 锁 。 

$ (lock word) 

锁 字 是 对 象 头 中 的 一 些 标记 位 ， 记 录 了 指定 对 象 的 加 锁 情 况 。 在 JRockit 中 ， 还 会 将 一 些 垃 
圾 回收 信息 记录 到 锁 字 中 。 

参见 对 象 头 。 

SWT 

SWT (standard widget toolkit ) 是 Eclipse RCP 平台 所 使 用 的 一 种 用 户 界 面 工具 库 。 当 然 ， 
JRockit Mission Control 也 用 上 了 。 
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逃逸 分 析 〈escape analysis) 

逃逸 分 析 是 一 种 代码 优化 手段 , 用 于 判断 指定 对 象 的 作用 域 , 并 在 可 能 的 情况 下 移 除 不 必要 
的 对 象 。 如 果 编 译 顺 能 证 明 对 象 的 作用 域 只 在 某 个 有 限 范围 内 , 并 且 不 会 “逃逸 ” 出 这 个 范围 ( 例 
如 某 个 对 象 是 作为 参数 被 传人 到 方法 中 )， 则 编译 器 就 可 以 省 去 为 该 对 象 分 配 内 存 的 操作 ， 直 接 
将 对 象 属 性 保存 到 局 部 变量 。 逃 逸 分 析 与 C++ 在 栈 (而 非 堆 ) 中 分 配对 象 有 异曲同工 之 妙 。 

提升 (promotion ) 

提升 是 指 将 对 象 提 升 到 一 个 可 以 更 长 久保 存 对 象 的 内 存 区 域 。 例 如 , 将 对 象 从 线程 局 部 区 域 
提升 到 堆 中 ,或 者 将 新 生 代 中 的 对 象 提升 到 老年 代 中 。 

参见 分 代 式 垃圾 回收 和 线程 局 部 区 域 。 

通道 (lane) 

在 JFR 的 Event | Graph 标签 页 中 ,通道 表示 了 一 条 追踪 路 径 ， 同 一 父 节 点 下 的 所 有 事件 都 
会 放置 在 同一 个 通道 中 。 因 此 , 确保 同一 父 节 点 下 所 有 事件 类 型 在 时 间 上 不 重合 可 以 更 好 地 显示 
出 事件 相关 性 。 

参见 事件 。 

透视 图 (perspective) 

透视 图 是 RCP 中 的 一 个 概念 ， 在 其 中 包含 预定 义 的 视图 。 例 如 ，JRockit Mission Control 透 
视图 中 包含 了 JRockit Mission Control 中 最 常用 的 一 些 视图 。 菜 单 Window | Reset Perspective 
可 用 于 重 置 为 默认 配置 。 

参见 富 客 户 端 平台 。 

跳板 (trampoline) 

跳板 是 一 种 用 在 JIT 编译 中 的 代码 生成 机 制 。 一 般 来 说 ， 跳 板 是 一 段 存储 于 内 存 中 的 本 地 代 
码 ,“ 假 装 ” 作 为 完整 编译 过 的 目标 方法 使 用 ( 实际 上 可 能 还 没 编译 完 )。 当 调用 目标 方法 时 ,会 
执行 跳板 代码 ， 生 成 真正 的 本 地 代码 ， 并 将 控制 流 指向 新 生成 的 代码 。 下 一 次 再 调用 该 目标 方法 
时 ,就 可 以 直接 执行 这 个 新 生成 的 本 地 代码 了 ， 跳 板 代 码 也 可 以 从 代码 缓冲 区 中 删除 。 

参见 方法 垃圾 回收 和 JIT 编译 。 

吞吐 量 (throughout) 

吞吐 量 通常 用 于 衡量 每 个 时 间 单 位 内 所 处 理 的 平均 
大 的 话 ， 就 没 必要 太 关 注 方差 的 大 小 了 。 

参见 延迟 和 并 行 垃圾 回收 。 

托管 型 虚拟 机 管理 程序 (hosted hypervisor) 

托管 型 虚拟 机 管理 程序 是 指 , 在 当前 操作 系统 中 , 作为 一 种 用 户 应 用 程序 来 运行 的 虚拟 机 管 
理 程序 。 

参见 虚拟 机 管理 程序 。 

图 融合 (graph fusion) 

图 融合 是 对 图 着 色 的 扩展 。 通 过 某 些 启发 式 算法 (通常 情况 下 是 根据 代码 块 的 热度 ), 将 IR 




























































































































































































有 务 数 。 一般 来 说 ,只 要 平均 否 吐 量 足 够 
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分 拆 为 几 个 子 区 域 ， 然后 分 别 对 每 个 子 区 域 着 色 ， 再 做 融合 操作 。 这 个 过 程 需要 在 相 邻 子 区 域 之 
间 的 边 上 生成 一 些 洗 牌 代码 来 记录 关联 关系 。 如 果 热 度 划 分 标准 足够 好 ,人 处理 代 码 时 可 以 直接 从 
最 热 的 部 分 开始 ， 那 这 个 算法 将 非常 有 用 ， 可 以 少 生成 一 些 额外 的 代码 。 

参见 着 色 、 寄 存 器 分 配 、 图 着 色 和 溢出 。 

图 着 色 〈graph coloring) 

在 寄存 器 分 配 算法 中 , 图 着 色 算法 用 于 计算 寄存 器 赋值 问题 。 同 时 使 用 的 变量 被 抽象 为 图 中 
相 邻 的 两 个 节点 ， 寄 存 器 分 配器 的 工作 就 是 ,在 相 邻 节点 不 能 同色 的 前 提 下 , 用 尽量 少 的 颜色 画 
满 途 中 所 有 的 节点 。 如 果 最 后 计算 出 所 需 颜 色 的 数量 大 于 可 用 寄存 器 的 数量 , 则 需要 使 用 溢出 技 
术 来 处 理 。 作 为 一 个 NP-hard 问题 ， 虽 说 图 着 色 问 题 可 以 求 出 近似 解 ， 但 仍 是 代码 生成 过 程 中 计 
算 量 最 大 的 生产 步 又 之 一 。 

参见 着 色 、 寄 存 器 分 配 、 图 融合 和 溢出 。 

volatile 属性 (volatile field) 

在 Java 中 ， 属 性 域 前 的 限定 符 volatile 规定 了 对 该 属性 域 的 访问 需要 符合 更 严格 的 内 存 
语义 ， 所 有 的 线程 都 会 立即 看 到 对 该 属性 域 的 修改 。 

参见 Java 内 存 模 型 。 

微 基 准 测试 (micro benchmark) 

微 基 准 测试 是 指 简单 小 巧 、 便 于 理解 的 测试 代码 ， 可 用 于 对 性 能 做 回归 测试 。 

线程 采样 (thread sampling) 

线程 采样 是 一 种 热 方 法 检测 机 制 , 其 具体 实现 是 周期 性 地 检查 把 时 间 花 在 了 哪个 方法 上 。 通 
常情 况 下 ， 在 采样 时 , 会 先 暂 停 应 用 程序 ， 此 时 线程 的 指令 指针 寄存 器 会 指向 正在 执行 的 方法 表 
或 代码 块 表 中 的 一 项 。 当 收集 到 足够 的 信息 后 , 就 可 以 判断 出 哪些 是 热 方 法 , 从 而 针对 性 地 优化 ， 
还 可 以 判断 出 一 个 方法 中 哪 条 执行 路 径 的 使 用 频率 更 高 。 

线程 池 (thread pool) 

线程 池 是 指 在 某 个 资源 池 始 终 保持 一 定数 量 的 活动 线程 ,以 降低 重复 创建 线程 的 开销 。 线程 
池 不 是 万 能 的 ， 应 根据 自身 场景 和 底层 线程 模型 来 判断 是 否 使 用 。 

线程 局 部 堆 (thread local heap, TLH) 

TLH 是 对 TLA 的 扩展 ,实现 垃圾 回收 时 ,可 以 使 用 几 个 稍 大 的 TLH 和 一 个 全 局 堆 。 若 是 应 
用 程序 中 绝 大 部 分 对 象 都 畴 于 线程 局 部 的 话 ， 则 大 部 分 对 象 都 不 会 被 提升 到 全 局 堆 中 , 也 就 不 会 
有 那么 多 同步 操作 了 。 一 般 来 说 ， 对 TLH 做 垃圾 回收 操作 的 开销 是 很 大 的 ， 因 为 读 屏 障 和 写 屏 
障 都 需要 检查 目标 对 象 是 否 会 被 其 他 线程 看 到 。 但 在 某 些 场景 下 〈 例如 专用 的 操作 系统 层 )， 是 
可 以 降低 这 种 开销 的 。 

参见 分 代 式 垃圾 回收 和 线程 局 部 区 域 。 

线程 局 部 分 配 (thrad local allocation) 

线程 局 部 分 配 是 指 在 线程 局 部 区 域 中 为 新 对 象 分 配 内 存 , 然后 在 必要 的 时 候 (线程 局 部 区 域 
已 满 或 需要 做 某 些 优化 )， 再 将 对 象 提 升 到 堆 中 。 

参见 线程 局 部 区 域 。 
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线程 局 部 区 域 (thread local area, TLA) 

TLA 是 指 在 线程 局 部 使 用 的 一 小 块 缓 冲 区 ， 用 于 为 线程 局 部 对 象 分 配 内 存 。 由 于 TLA ER 
程 局 部 的 ， 使 用 时 无 须 加 锁 ， 可 以 大 大 降低 为 对 象 分 配 内 存 的 开销 。 当 TLA 已 满 时 ， 需 要 将 其 
中 的 对 象 提升 到 堆 空 间 中 。 

写 屏 障 (write barrier) 

通常 来 说 ， 写 屏障 是 由 编译 器 生成 的 小 代码 块 , 在 执行 存储 属性 域 的 时 候 会 被 调用 。 当 存储 
属性 域 会 影响 到 系统 其 他 部 分 时 , 需要 用 到 写 屏 障 。 例如， 在 分 代 式 垃圾 回收 中 ， 由 于 垃圾 回收 
器 需要 跟踪 从 老年 代 指 向 新 生 代 的 引用 ， 可 通过 写 屏障 来 标记 是 否 对 堆 的 某 个 部 分 执行 过 写 操 
作 ， 从 而 避免 了 对 整个 堆 的 扫描 操作 。 

参见 读 屏障 、 分 代 式 垃圾 回收 、 老 年 代 和 新 生 代 。 


=o =E 


55 = (semaphore) 

信号 量 是 一 种 构建 于 wait 和 notify 语义 之 上 的 同步 机 制 。Java 中 的 每 个 对 象 都 有 wait 
和 notify 方法 。 

在 同步 上 下 文中 执行 wait 方法 会 使 当前 进程 进入 休眠 状态 ， 直 到 接收 到 唤醒 通知 。 在 同步 
上 下 文中 执行 notify 方法 会 通知 调度 器 唤醒 阻塞 在 目标 监视 器 上 的 其 他 某 个 线程 。Java 中 的 
notifyAll 方法 与 wait 方法 类 似 , 区 别 在 于 notifyall 方法 会 唤醒 阻塞 在 目标 监视 器 上 的 所 
有 线程 ， 其 中 一 个 会 获得 监视 器 ， 其 余 的 线程 会 再 次 休 眼 。notifyAll 方法 可 以 更 好 地 避免 死 
锁 情 况 的 出 现 ， 但 会 带 来 一 点 额外 的 性 能 消耗 。 

参见 死 锁 和 监视 器 。 

信任 库 (truststore) 

信任 库 中 存储 了 可 信 方 的 证 书 。 

参见 密 钥 库 。 

新 生 代 〈young space) 
新 生 代 是 堆 空 间 的 一 部 分 , 按 大 小 来 说 通常 会 比 整个 堆 小 几 个 数量 级 , 用 于 存储 刚刚 创建 的 
新 对 象 。 新 生 代 主要 用 于 存储 临时 对 象 和 短 生命 周期 对 象 ( 以 实际 情况 来 说 ， 大 部 分 对 象 确实 是 
这 样 的 )， 其 垃圾 回收 过 程 也 是 独立 进行 的 。 由 于 新 生 代 通常 较 小 ， 其 垃圾 回收 的 次 数 也 可 以 相 
对 频繁 一 些 。 当 新 生 代 中 的 对 象 经 过 若干 轮 垃圾 回收 后 依然 存活 ， 则 需要 将 之 提升 到 老年 代 中 ， 
那里 的 存储 空间 更 大 ， 垃 圾 回收 的 频率 也 更 低 一 些 。 

在 本 书 中 ,“ 新 生 代 ”和 “年 轻 代 ”是 同一 个 意思 。 

参见 分 代 式 垃圾 回收 。 

新 生 代 (nursery) 

参见 新 生 代 。 

虚拟 化 (virtualization) 

虚拟 化 是 指 在 虚拟 或 模拟 硬件 上 ， 通 过 虚拟 机 管理 程序 来 运行 客户 应 用 程序 (例如 操作 系 
统 )。 通 过 虚拟 化 ， 可 以 使 多 个 客户 应 用 程序 同时 运行 在 一 台 物 理 机 器 上 ， 提 升 了 机 器 的 资源 利 
用 率 。 此 外 ,借助 于 统一 的 管理 框架 ， 可 以 将 一 组 物理 机 器 抽象 为 计算 云 , 通过 虚拟 化 的 方式 为 
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客户 提供 计算 资源 。 

参见 客户 应 用 程序 、 虚 拟 机 管理 程序 、 全 虚拟 化 和 半 虚 拟 化 。 

虚拟 机 管理 程序 (hypervisor) 

虚拟 机 管理 程序 是 一 种 允许 多 个 操作 系统 ( 也 称 为 客户 应 用 程序 ) 同时 运行 在 一 台 物 理 机 器 
上 的 应 用 软件 ， 可 以 为 客户 应 用 程序 提供 硬件 抽象 。 

参见 虚拟 化 、 客 户 应 用 程序 、 本 地 型 虚拟 机 管理 程序 和 托管 型 虚拟 机 管理 程序 。 

虚拟 机 镜像 (virtual machine image) 

在 本 书 中 , 虚拟 机 镜像 是 指 用 于 虚拟 化 场景 的 文件 包 , 通常 会 包含 针对 于 指定 虚拟 机 管理 程 
序 的 配置 文件 和 若干 用 于 运行 预 装 应 用 程序 的 磁盘 镜像 。 有 时 候 , 虚拟 机 镜像 也 称 为 虚拟 镜像 和 
MEVEN 

参见 虚拟 化 。 

虚 引 用 (phantom reference) 

参见 软 引 用 。 

延迟 (latency) 

延迟 是 指 执行 事务 时 的 开销 ,这 部 分 开销 对 事务 本 身 是 没有 用 的 。 例如， 虚拟 机 中 执行 代码 
生成 和 内 存 管理 都 会 带 来 额外 的 执行 开销 , 需要 开启 一 个 事务 来 完成 。 无 法 预测 的 延迟 会 带 来 不 
小 的 麻烦 ， 因 为 不 能 预测 开销 的 话 ， 就 没 办 法 确定 负载 等 级 。 有 时 候 ， 为 了 能 预测 延迟 ， 而 不 得 
不 降低 系统 总 知 吐 量 。 

参见 STW 、 确 定式 垃圾 回收 、 并 发 垃圾 回收 和 并 行 垃圾 回收 。 

延迟 解锁 (lazy unlocking) 

延迟 解锁 ， 有 时 也 称 偏 问 锁 ， 是 一 种 对 锁 行 为 的 优化 手段 ， 即 假设 大 部 分 锁 都 只 是 线程 局 部 
的 ， 没 必要 频繁 地 做 释放 和 获取 操作 。 在 延迟 解锁 中 ,运行 时 就 是 在 赌 “ 锁 会 一 直 保 持 在 线程 局 
部 内 ”。 当 第 一 次 释放 锁 时 ， 运 行 时 可 能 会 选择 不 去 释放 它 ， 直 接 跳 过 释放 操作 ， 这 样 当 下 次 同 
一 个 线程 再 来 获取 这 个 锁 时 ， 也 就 不 必 再 做 加 锁 操 作 了 。 当 然 ， 最 坏 的 情况 是 ， 另 一 个 线程 试图 
获取 这 个 实际 上 并 未 被 释放 的 锁 ,， 这 时 只 能 先 将 锁 转 换 为 普通 模式 的 锁 ， 强 制 释 放 该 锁 ， 会 带 来 
额外 的 性 能 开销 。 因 此 ， 若 应 用 程序 中 线程 竞争 非常 激烈 ， 就 不 适宜 使 用 延迟 解锁 。 

一 般 来 说 , 实现 延迟 解锁 时 会 应 用 各 种 启发 式 算法 , 使 其 在 不 断 变化 的 运行 环境 中 达到 更 好 
的 执行 性 能 ， 例 如 对 那些 线程 竞争 太 过 激烈 的 对 象 禁用 延迟 解锁 。 

ERBE (latency threshold) 

JER 中 的 计时 事件 中 包含 了 有 关 超 时 时 间 阔 值 的 设 定 ， 知 是 事件 的 持续 时 间 小 于 该 闽 值 ， 则 
不 会 记录 该 时 间 。 

参见 Rockit Flight Recorder. 

压缩 引用 (compressed reference) 

压缩 引用 是 Java 对 象 模 型 的 一 种 实现 机 制 ， 在 这 种 机 制 下 ， 应 用 程序 中 对 象 的 引用 会 比 系 
统 级 的 指针 小 。 例 如 ,在 64 位 系统 上 ， 如 果 Java 堆 小 于 4 GB， 则 记录 对 象 地 址 只 需 32 位 就 够 
了 ， 在 运行 时 中 使 用 64 位 完全 是 浪费 。 载 人 和 和 解 引用 Java 对 象 的 指针 会 有 一 点 开销 (不 过 并 不 
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大 )， 却 可 以 极 大 地 提升 系统 的 运行 速度 。 

参见 引用 压缩 和 引用 解压 缩 。 

页 保护 (page protection) 

页 保护 是 指 将 虚拟 内 存 的 某 个 页 面 标记 为 不 可 用 或 不 可 执行 (如 果 页 面 中 包含 了 代码 的 话 )， 
因此 ， 当 访问 这 个 页 面 时 会 触发 一 个 异常 。 页 保护 机 制 可 用 于 实现 栈 溢出 检测 、 启 动 安全 点 ( 暂 
停 应 用 程序 线程 的 位 置 )， 以 及 将 无 用 代码 换 出 等 操作 。 

参见 保护 页 和 安全 点 。 

溢出 (spilling) 

寄存 器 分 配 起 需要 将 一 大 堆 变 量 映射 到 少量 的 物理 寄存 器 上 。 如 果 同 时 使 用 的 变量 数目 比 可 
用 寄存 器 的 数目 多 的 话 ， 就 不 得 不 将 一 些 变量 先 临 时 存储 到 内 存 中 ， 这 就 是 Spilling。 通 常情 况 
下 ,会 将 这 些 无 法 同时 处 理 的 变量 放 到 生成 这 些 变量 的 栈 帧 中 。 大 量 使 用 Spilling 技术 会 带 来 巨 
大 的 性 能 损耗 。 

参见 寄存 器 分 配 和 原子 指令 。 

硬件 预 抓 取 《hardware prefetching) 

硬件 预 抓 取 是 一 种 基于 硬件 的 预 抓 取 实 现 ， 通 常情 况 下 ， 是 指 CPU 无 须 与 应 用 程序 交互 ， 
通过 启发 式 算法 ， 在 访问 数据 之 前 ， 预 先 将 目标 数据 抓 取 到 缓存 中 。 

参见 预 抓 取 和 软件 预 抓 取 。 

硬 实时 (hard real-time) 

硬 实时 是 指 运行 环境 对 实时 性 的 要 求 很 高 ， 需 要 精确 控制 延迟 时 间 。 对 于 Java 服务 器 端 应 
用 程序 来 说 ， 通 常 这 没 必 要 ， 软 实时 就 够 了 ， 即 控制 延迟 等 级 即 可 ， 无 须 精 确 控制 延迟 时 间 。 

参见 软 实时 。 

引用 解压 缩 〈reference decompression) 

引用 解压 缩 是 指 将 被 压缩 的 引用 反 解 回 引 用 的 原始 形式 。 

参见 压缩 引用 和 引用 压缩 。 

引用 计数 (reference counting) 

引用 计数 是 一 种 垃圾 回收 方法 , 记录 每 个 对 象 被 引用 的 次 数 。 当 引用 计数 降 为 0 的 时 候 , 会 
将 该 对 象 回收 掉 。 引 用 计数 实现 简单 ， 却 有 一 个 固有 缺陷 ， 那 就 是 无 法 处 理 循环 引用 的 问题 。 

参见 引用 追踪 垃圾 回收 。 

引用 压缩 (reference compression) 

引用 压缩 是 指 将 原始 大 小 的 引用 转换 为 更 小 的 形式 。 

参见 压缩 引用 和 引用 解压 缩 。 

引用 追踪 垃圾 回收 (tracing garbage collection) 

引用 追踪 垃圾 回收 是 指 遍历 堆 中 对 象 的 所 有 引用 , 找 出 所 有 相关 联 的 对 象 , 从 而 建立 存活 对 
象 集 。 在 遍历 之 后 ， 没 有 被 扫描 到 的 对 象 将 会 被 认为 是 无 用 对 象 而 被 回收 掉 。 

参见 标记 -清理 和 暂停 -复制 。 
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优化 队列 Coptimization queue) 

优化 队列 是 JRockit 中 的 专 有 名 词 ， 是 指 用 于 存储 代码 生成 请 求 的 队列 。 优 化 器 线程 会 通过 
该 队列 获取 优化 请 求 ， 对 目标 代码 优化 。 

参见 代码 生成 队列 。 

原子 指令 (atomic instruction) 

原子 指令 在 执行 时 ,无 论 操作 对 象 是 什么 ， 指 令 要 么 都 执行 ,要么 都 不 执行 。 在 执行 普通 指 
令 时 ,根据 硬件 模型 的 不 同 ， 可 能 会 因 弱 内 存 语义 而 乱 序 执行 , 相 比 之 下 ， 原 子 指令 的 执行 时 间 
通过 会 比 普通 指令 多 几 个 数量 级 。 大 部 分 CPU 架构 所 支持 的 CAS 指令 就 是 一 个 原子 指令 。 

参见 CAS。 

预 编 译 (ahead-of-time compilation) 

一 般 来 说 , 预 编 译 是 指 在 执行 代码 之 前 先 对 全 部 或 部 分 进行 编译 。 例 如 C++ 编译 器 在 生成 二 
进 制 可 执行 文件 时 就 是 这 样 的 。 
参见 JIT 编译 。 
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(cloud) 

是 指 集中 大 量 分 布 式 计算 资源 ( 可 能 是 虚拟 计算 资源 )， 用 户 可 以 在 其 中 部 署 自己 的 应 用 

程序 。 与 一 大 堆 带 有 不 同属 性 的 物理 机 不 同 ， 云 中 的 一 组 服务 器 可 以 看 作 一 个 大 的 计算 资源 池 。 
参见 虚拟 化 。 

运行 模式 (run mode) 
默认 情况 下 ，JFR 的 用 户 界 面 是 以 运行 模式 启动 的 。 

参见 设计 模式 。 

预 抓 取 (prefetching) 

预 抓 取 是 指 在 CPU 访问 某 个 内 存 位置 之 前 ， 就 预先 将 该 内 存 位 置 处 的 内 容 抓 取 到 缓存 行 
(cache line ) 中 缓存 起 来 。 尽 管 预 抓 取 是 个 比较 费时 的 操作 ， 但 如 果 预 抓 取 和 实际 内 存 访问 操作 
的 时 间 间 隔 〈 执行 其 他 一 些 不 相关 的 指令 ) 够 大 ， 则 采用 预 抓 取 是 可 以 带 来 较 大 性 能 提升 的 。 

预 抓 取 工作 ， 可 以 是 由 CPU 隐 式 完成 的 (硬件 预 抓 取 ), 也 可 以 是 由 程序 员 显 式 地 将 预 抓 取 
§ 邻 写 入 到 代码 中 来 完成 ( 软件 预 抓 取 )。 

一 般 来 说 ， 软 件 预 抓 取 是 由 编译 器 通过 一 些 启 发 式 算法 加 入 到 代码 中 的 。 例 如 ,在 JRockit 
中 , 预 抓 取 指 令 会 搬入 到 访问 线程 局 部 区 域 的 为 对 象 分 配 内 存 的 代码 中 , 以 及 为 执行 大 量 属 性 域 
访问 操作 而 优化 过 的 代码 中 。 若 是 将 预 抓 取 指令 放 错 位 置 ， 则 会 降低 系统 的 整体 性 能 。 

参见 线程 局 部 区 域 、 硬 件 预 抓 取 和 软件 预 抓 取 。 

暂停 -复制 (stop and copy) 

暂停 -复制 是 一 种 引用 追踪 垃圾 回收 技术 ， 它 会 将 堆 分 为 相等 的 两 部 分 ， 并 且 每 次 只 会 使 用 
其 中 一 个 。 在 执行 垃圾 回收 时 , 引用 追踪 算法 会 增 量 式 地 计算 存活 对 象 集 ， 并 将 之 移入 到 男 一 个 
未 被 使 用 的 堆 空 间 , 这 种 方式 隐 式 地 实现 了 内 存 整 理 。 在 垃圾 回收 之 后 , 男 一 个 堆 空 间 中 的 全 是 
存活 对 象 ， 并 作为 新 的 堆 空 间 使 用 ， 而 当前 被 收集 的 堆 空间 则 会 被 全 部 回收 。 该 算法 实现 简单 ， 
但 会 浪费 大 量 的 堆 空间 。 
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参见 引用 追踪 垃圾 回收 、 内 存 整 理 和 碎片 化 。 

自动 内 存 管理 (automatic memory management) 

本 书 中 ， 自 动 内 存 管理 是 指 在 运行 时 系统 中 使 用 垃圾 回收 器 来 管理 内 存 。 

字 节 码 (bytecode) 

字 节 码 是 由 源 代码 转化 成 的 、 平 台 无 关 的 二 进 制 表示 。 就 Java 来 说 ， 字 节 码 由 Java 源 代码 
编译 而 成 。Java 字 节 码 中 包含 了 操作 指令 (长度 为 1 个 字 节 ) 和 操作 数 ， 其 结构 化 程度 不 如 Java 
源 代码 ， 可 以 任意 使 用 goto 指令 和 其 他 Java 源 代码 中 不 存在 的 结构 ， 因 此 其 表现 力也 远 强 于 
Java 源 代 码 。 

字 节 码 解释 执行 (bytecode interpretation) 

字 节 码 解释 执行 是 指 , 在 虚拟 执行 栈 中 ， 以 模拟 字 节 码 指令 、 虚 拟 机 状态 和 本 地 变量 表 的 形 
式 来 运行 字 节 码 代 码 。 字 节 码 解释 执行 的 启动 速度 比 编译 执行 快 ， 但 运行 性 能 较 差 。 

自 适应 代码 生成 (adaptive code generation) 

自 适应 代码 生成 是 指 在 自 适应 环境 中 动态 生成 代码 ,例如 JIT 和 混合 模式 解释 执行 代码 。 一 
般 情况 下 ， 自 适应 代码 生成 会 根据 运行 时 反馈 信息 ， 对 代码 做 多 次 优化 。JVM 是 一 个 自 适 应 环 
境 ， 可 以 动态 生成 代码 ， 而 静态 编译 系统 则 无 法 办 到 。 

参见 JIT 编译 和 混合 模式 解释 执行 。 

自 适应 内 存 管 理 (adaptive memory management) 

自动 内 存 管理 是 指 应 用 某 种 自 适应 内 存 管理 技术 (例如 垃圾 回收 器 ) 来 管理 内 存 。 本 书 中 的 
自 适应 内 存 管 理 是 指 为 了 提升 性 能 而 根据 运行 时 反馈 信息 来 调整 垃圾 回收 器 的 行为 。 

自 旋 锁 (spinlock) 

自 旋 锁 的 实现 中 通常 包含 了 原子 指令 和 条 件 跳 转 ,形成 一 个 循环 ,在 完成 操作 之 前 , 会 一 直 
消耗 CPU 资源 。 使 用 自 旋 锁 来 实现 简单 的 、 没 什么 竞争 的 、 持 有 时 间 也 不 长 的 同步 锁 是 挺 不 错 
的 ， 不 过 对 于 大 部 分 应 用 程序 来 说 ， 自 旋 锁 并 不 是 最 佳 选择 。 

参见 疫 锁 和 胖 锁 。 

栈 上 蔡 换 (on-stack replacement, OSR) 

栈 上 替换 是 一 种 代码 优化 技术 ， 即 在 方法 运行 过 程 中 就 将 控制 流 切换 到 优化 编译 之 后 的 新 方 
KE. Rocki 本身 并 不 支持 OSR， 它 会 等 到 目标 方法 执行 结束 后 再 替换 。 对 于 某 些 编写 糟糕 的 微 
基准 测试 来 说 ， 这 种 实现 方式 是 测 不 出 好 结果 的 ， 但 实践 证 明 ， 不 支持 OSR 并 不 是 什么 大 问题 。 












































































































































































































































着 色 (color) 

在 本 书 中 , 着 色 是 指 对 具有 某 种 特性 的 节点 进行 标记 , 常用 于 寄存 器 分 配 算法 或 引用 追踪 垃 
圾 回收 算法 。 

在 寄存 器 分 配 算法 中 , 同时 使 用 的 变量 可 以 表示 为 图 中 的 两 个 相 邻 节点 ,于 是 寄存 需 分 配 算 
法 就 可 以 转化 为 “如 何 对 图 中 的 节点 着 色 ， 使 相 邻 节 点 具有 不 同 的 颜色 ”， 其 中 可 用 颜色 的 数量 
等 于 可 用 寄存 器 的 数量 。 








此 外 ， 着 色 还 可 应 用 于 引用 追踪 垃圾 回收 算法 。 通 常情 况 下 ， 标 记 -清理 算法 会 使 用 若干 种 
颜色 来 标记 垃圾 回收 过 程 已 经 处 理 过 的 若干 种 对 象 。 
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参见 寄存 器 分 配 和 引用 追踪 垃圾 回收 。 

诊断 命令 (diagnostic command) 

通过 JRCMD、 名 为 DiagnosticCommand 的 MBean 或 JMAPI 可 以 给 JRockit JVM 发 送 指 
定 的 诊断 命令 。 

参见 IRCMD 和 JMAPI。 

中 间 表 示 (intermediate representation, IR) 

中 间 表 示 是 代码 在 编译 器 内 部 的 表示 形式 。 通 常情 况 下 ,中 间 表 示 既 不 是 编译 语言 ， 也 不 是 
本 地 代码 ,而 是 介 于 两 者 之 间 的 、 更 具 通 用 性 的 表示 形式 , 格式 良好 的 中 间 表 示 应 该 是 便于 优化 
和 转换 的 。 在 JRockit 中 ， 中 间 表 示 也 分 为 多 个 层次 ， 最 上 层 表 示 与 Java 代码 类 似 ， 最 下 层 表 示 
则 更 像 本 地 代码 ， 算 是 一 种 标准 划分 形式 。 

参见 高 级 中 间 表 示 、 中 级 中 间 表 示 、 低 级 中 间 表 示 、 寄 存 器 分 配 和 本 地 代码 。 

中 级 中 间 表 示 (middle level intermidiate representation, MIR) 

在 JRockit 中 ，MIR 是 一 个 有 向 控制 流 图 ， 其 以 基本 块 作 为 图 的 节点 ， 每 个 基本 块 都 包含 了 
0 个 或 多 个 操作 。JRockit 中 的 MIR 是 平台 无 关 的 ， 同 时 也 是 对 代码 做 平台 无 关 优化 的 阶段 ， 其 
具体 格式 类 似 于 三 地 址 码 。 

参见 高 级 中 间 表 示 、 低 级 中 间 表 示 、 寄 存 器 分 配 、 本 地 代码 和 中 间 表 示 。 

主 密码 (master password) 

主 密码 用 于 对 存储 在 JRockit Mission Control 中 的 密码 做 加 密 和 解密 操作 。 

准确 分 析 (exact profiling) 

准确 分 析 是 指 以 注入 代码 的 形式 来 获取 准确 的 分 析 结 果 , 例如 对 每 个 方法 调用 计时 或 对 每 个 
方法 调用 计数 。 这 种 方式 通常 都 会 带 来 一 点 性 能 开销 

参见 采样 分 析 。 

准确 式 垃圾 回收 (exact garbage collection) 

与 保守 式 垃圾 回收 相反 , 准确 式 垃圾 回收 要 求 运行 时 提供 足够 的 元 数据 信息 ,以 便 明确 知道 
寄存 器 和 栈 帧 中 的 哪些 位 置 存储 了 对 象 指针 , 这 样 垃 圾 回收 器 就 不 必 猜 测 数据 到 底 是 不 是 对 象 指 
针 。 元 数据 虽然 增加 了 内 存 消耗 ， 却 可 以 加 快 垃圾 回收 的 执行 速度 ， 并 提升 回收 操作 的 准确 性 。 

参见 保守 式 垃 圾 回收 。 
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作为 曾经 的 三 大 主流 Java 虚 拟 机 之 一 ，JRockit 展 示 了 强大 的 伸缩 性 和 高 劲 的 性 能 ， 现 在 虽 已 被 
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